2026年,想用一块Xilinx的Kria KV260视觉AI入门套件完成‘智能零售货架商品识别与缺货检测系统’的毕业设计,在实现多路摄像头接入、YOLO目标检测模型部署和结果可视化时,如何利用其异构计算架构(FPGA+ARM)来优化系统吞吐率和能效?
我的毕设题目是基于KV260做商品识别系统。套件有FPGA可编程逻辑和ARM处理器。我计划用MIPI摄像头采集货架图像,在FPGA上做预处理(比如缩放、格式转换),然后通过DPU跑量化后的YOLOv5模型做检测,最后在ARM上运行应用逻辑并显示。但我是第一次接触这种异构平台,不太清楚如何合理划分软硬件任务,让数据在PL和PS之间高效流动。比如,该用AXI DMA还是AXI Stream?如何为DPU准备输入数据?整个系统的流水线怎么设计才能不卡顿?希望有使用过KV260或类似平台的朋友分享一些架构设计和性能调优的经验。