2026年,FPGA毕设选题‘基于Zynq MPSoC的软硬件协同智能视觉检测系统’,在实现中将AI模型部署在PL端加速,PS端运行Linux和应用软件,如何进行合理的软硬件任务划分、高效的数据交互(如通过AXI DMA)以及系统级的性能评估与优化?
我的毕设题目是基于Xilinx Zynq UltraScale+ MPSoC平台,做一个智能视觉检测系统,比如缺陷检测。计划用PL(FPGA)部分做图像预处理和神经网络加速,PS(ARM)部分跑Linux和上层控制软件。现在在系统架构设计上遇到了困惑:1. 哪些算法适合放在PL实现,哪些适合放在PS?判断依据是什么?2. PS和PL之间通过AXI总线通信,数据量很大时,如何使用DMA来提高吞吐量,具体配置流程是怎样的?3. 最后如何评估整个系统的性能瓶颈(是PL算力不足,还是PS与PL通信带宽不够,或者是软件调度问题)?希望有做过类似系统的前辈能给一些实战经验分享。