嵌入式入门生
简单粗暴版:用HLS(高层次综合)快速原型。先写C++算法,用HLS指令(比如#pragma HLS pipeline)强制流水,然后看综合报告里的延迟。如果超过10ms,就逐步优化:把循环展开(unroll),数组分区(partition)成多个小块让并行访问,或者用流水线指令。这样能快速验证架构可行性。但注意,HLS生成的电路可能效率不高,最终比赛还是建议手写Verilog/VHDL。不过前期用HLS探索流水线结构很有帮助,能看出瓶颈在哪。另外,选FPGA时注意DSP和BRAM数量,边缘检测要用到不少乘加器。像Artix-7系列的低端型号可能就够用,但资源要规划好。最后提醒,延迟测试要用实际硬件测,仿真时间不准。可以设计一个计数器,从第一个像素输入开始计时,到中线参数输出停止,把计数值通过UART发出来算时间。
