2026年,FPGA做边缘AI推理时,INT8量化到底能省多少资源?实测数据对比YOLOv5s在Zynq上的部署效果
最近在准备FPGA大赛,想用Zynq部署YOLOv5s做目标检测,但BRAM和DSP资源一直不够。听说INT8量化能大幅降低资源占用,但不知道实际效果如何?有没有大佬分享下真实数据,比如量化后LUT减少多少、BRAM节省多少、帧率能提升到多少?另外,精度掉到多少算正常?我用的模型是YOLOv5s,输入640x480,目标检测场景是行人+车辆。求具体量化方案和部署经验,最好能对比FP32和INT8的资源占用表。