FPGA学员3
我分享点实战坑和选择建议。首先,选题不错,但硬件化改造的关键是‘简化算法、拥抱并行’。滤波部分,体素滤波本质是降采样,可以设计多个并行的体素处理单元(PE),每个PE处理一个体素块,数据流采用乒乓缓冲,一边输入新点,一边处理旧点。统计滤波则更吃存储带宽,建议用片上RAM缓存局部点集,计算均值方差时用流水线加法树。聚类部分,别硬怼DBSCAN,考虑用欧氏聚类或区域生长法,它们更易于硬件实现:比如将点云投影到二维网格,用硬件友好标签传播。国产FPGA开发,安路的TD软件和紫光的PDS都还行,但IP少,自定义计算单元得从头写。遇到综合后时序不达标,常见原因是组合逻辑太长,多打拍流水线。开源参考可以看GitHub上‘FPGA-point-cloud-processing’项目,虽然基于Xilinx,但架构可借鉴。最后,比赛注重系统完整性和创新点,不必追求全算法硬件化,CPU+FPGA协同处理也许更现实。
