2026年,FPGA大赛做实时视频目标检测,YOLOv8n在Zynq上部署时BRAM不够用,怎么通过模型剪枝和量化压缩硬挤出来?
我们团队今年准备FPGA大赛,选题是实时视频目标检测,打算在Zynq上部署YOLOv8n。模型量化到INT8后精度掉了3个点还能接受,但BRAM直接爆了,只剩下不到200KB。试过用LUT替代部分BRAM做缓存,但时序又过不去。有没有大佬分享下具体的模型剪枝策略和量化压缩步骤,比如怎么对卷积层做通道剪枝后微调,或者用知识蒸馏辅助量化?求一个能在Zynq上跑起来还能保持30帧的方案。