2026年全国大学生集成电路创新创业大赛,选择‘基于FPGA的端侧实时语音唤醒与关键词识别系统’,在实现MFCC特征提取、神经网络加速和低功耗设计时,如何平衡识别精度、实时性和FPGA资源消耗?
我们团队准备参加集创赛,题目定在端侧AI语音处理。计划用FPGA实现从音频采集、预处理(MFCC)、到轻量化神经网络(比如CNN或RNN)推理的完整流程。最大的困惑是如何在资源有限的FPGA上,同时满足高识别率、低延迟(实时响应)和低功耗的要求。在算法模型选择、硬件架构设计(比如如何并行化计算)、以及数据精度(定点化)方面,有什么具体的优化策略和权衡技巧可以分享吗?