2026年,做‘基于FPGA的实时视频人脸检测’毕设,如何用Zynq实现Haar特征级联分类器加速并优化DDR读写带宽?
我大四,毕设题目是‘基于FPGA的实时视频人脸检测系统’,用Zynq-7020平台。目前我实现了摄像头采集和HDMI显示,但用纯RTL写Haar特征级联分类器时,发现滑动窗口和特征计算导致BRAM不够用,而且AXI VDMA读写DDR的带宽成了瓶颈。想请教有经验的前辈,如何优化特征存储(比如用行缓存还是Block SRAM)?还有,是否需要将部分计算搬到PS端用OpenCV做?怎么平衡PL和PS的负载?