2026年,想用FPGA实现一个‘实时目标检测’的本科毕设,在资源有限的Zynq平台上,如何对YOLO系列轻量级模型进行硬件友好的剪枝、量化与流水线部署?
老师您好,我是一名电子信息工程专业的大四学生,正在准备毕业设计。我想用Zynq-7020开发板实现一个实时目标检测系统,初步想用YOLOv3-tiny或YOLOv5s这类轻量级模型。但板子上的PL资源(DSP、BRAM)非常有限,直接部署肯定不行。想请教一下,在硬件资源紧张的FPGA上,具体应该如何对模型进行有效的剪枝和定点量化?另外,整个检测流水线(图像预处理、网络推理、后处理)的硬件架构应该如何设计才能最大化利用并行性并满足实时性要求?有没有一些开源的参考项目或工具链(比如Vitis AI)可以借鉴?感觉从软件模型到硬件部署的鸿沟好大,希望能得到一些具体的指导。