2026年FPGA做AI加速,用Zynq部署YOLOv8n时,怎么把BRAM消耗控制在200KB以内?求具体裁剪方法
最近在做FPGA大赛的AI加速项目,用Zynq跑YOLOv8n,但BRAM总是超标,已经优化了量化位宽和卷积核复用,还是压不到200KB以下。有没有人分享过具体的模型裁剪技巧?比如怎么剪枝通道数、减少特征图深度,或者用分布式RAM替代部分BRAM?另外,PL端和PS端的数据搬运也占了不少BRAM,有没有办法通过AXI4-Stream流水线来减少缓存?求真实踩坑经验,不想因为资源问题丢分。