2026年,全国大学生FPGA创新设计大赛备赛,如果选择“基于FPGA的实时手势识别与HMI交互系统”作为题目,在实现摄像头图像采集、CNN手势识别算法加速和VGA/HDMI显示时,如何利用FPGA的流水线和并行性来满足实时性(如60FPS)要求?有哪些软硬件协同设计的优化思路?
我们团队计划参加2026年的FPGA大赛,选题是做一个实时的手势识别交互系统。初步想法是用OV5640摄像头采集图像,在FPGA上加速一个轻量级CNN(比如MobileNet)进行手势分类,结果通过VGA或HDMI实时显示。但我们担心算法的复杂度和FPGA资源的限制。具体问题有:1. 如何设计图像预处理(缩放、归一化)和CNN计算的数据流,才能最大化利用FPGA的并行计算单元?2. 是应该用HLS高层次综合快速搭建原型,还是手写Verilog来精细优化?3. 如何平衡识别精度(网络规模)与处理速度、功耗之间的关系?希望有参赛经验的学长或工程师能分享一些核心的架构设计思路和常见的“坑”。