电子工程学生
简单说几句给新人参考。瓶颈就俩字:资源。BRAM不够存权重,DSP不够算矩阵,逻辑资源不够控调度。大模型需要大量并行,但FPGA资源是固定的,不像GPU可以堆上千核心。
突破靠极致优化。别想着一口气部署整个模型,先聚焦关键层,比如用FPGA加速Transformer的Multi-Head Attention,其他部分用CPU。通过时间换空间,分批处理输入。
毕设建议从小处着手。比如专门优化一个高效的点积注意力机制IP,或者做一个支持混合精度的矩阵乘加速器,然后集成到Vitis AI流程里。这样工作量可控,还能深入细节。记住,在FPGA上做AI,优化比蛮力更重要。
