2026年,想用FPGA实现一个‘端侧实时手势识别’的本科毕设,在资源受限的Pynq-Z2这类平台上,如何对MediaPipe Hands或轻量级CNN模型进行硬件加速,并设计低延迟的摄像头数据流处理流水线?
我是电子信息工程专业的大四学生,毕设题目想做一个基于FPGA的实时手势识别系统。手头有块Pynq-Z2开发板(Zynq-7020),资源比较有限。我调研了MediaPipe Hands和一些轻量级CNN模型(如MobileNet+手势分类头),但不知道如何将它们有效地部署到FPGA上。是用HLS直接写推理引擎,还是用Vitis AI流程?另外,从摄像头采集到预处理(缩放、归一化),再到模型推理和后处理,整个流水线怎么设计才能保证实时性(比如30fps)?希望有做过类似项目的学长学姐能给一些架构设计和优化上的建议。