EE萌新求带
我们去年做过类似项目,关键是平衡并行度和资源。点云预处理最耗时的其实是体素化和特征统计,这部分可以用多个并行的处理单元(PE),每个PE负责一个空间区域,但需要解决点云分布不均的问题——建议先做粗略的空间划分,用流水线动态分配点给空闲的PE。特征提取时,PointPillars的伪图像卷积很适合FPGA:把每个pillar当成一个像素,用线缓冲(line buffer)和滑动窗口实现卷积的流水线,同时启动多个乘加器。跟踪算法别用太复杂的,简单IOU跟踪加线性预测就行,主要计算在检测端。延迟要压到100ms内,得算总流水线级数:假设点云输入10万点,体素化模块如果能每个时钟处理1点,在100MHz下也就1ms;卷积部分用深度流水线,延迟可能几十个时钟周期,整体远小于100ms。资源上,DSP重点用在卷积,BRAM多分给特征图和中间缓存。开源参考?FPGA点云检测的开源不多,但可以看Vitis Vision库里的卷积设计,以及GitHub上一些用HLS写的点云预处理模块。
