Verilog入门者
我毕设用过 KV260,分享点经验。软硬件划分:图像采集、缩放、格式转换(到 DPU 需要的格式)全放 FPGA(PL)。ARM(PS)只负责启动 DPU、读结果、逻辑判断和显示。数据流动用 AXI Stream + VDMA 是最佳实践,Vitis 里有相关 IP 和例子。为 DPU 准备数据的关键是,你的 FPGA 预处理输出要直接对齐 DPU 输入张量的内存布局。建议先用纯软件在 ARM 上跑通整个流程,确定好 DPU 的输入输出格式,再着手 FPGA 设计。系统流水线不卡顿的要点是缓冲:FPGA 预处理完一帧就存 DDR,DPU 从 DDR 读,ARM 取结果,这三段可以并行。确保每个环节的处理时间小于帧间隔。多路摄像头的话,如果 DPU 处理一帧的时间大于多路的总帧间隔,就得考虑降低路数或使用更轻的模型。另外,KV260 的 DPU 支持批量处理(batch),可以试试一次处理多帧来提高吞吐,但会增加延迟,看你需求。
