FPGA线上课程平台|最全栈的FPGA学习平台|FPGA工程师认证培训
登录
首页-所有问题-其他-正文

2026年,FPGA大赛做实时语音识别,用国产高云FPGA部署轻量级Transformer,BRAM不够用有哪些层融合和内存复用的具体策略?

电路玩家新手电路玩家新手
其他
4小时前
0
0
3
我们队今年FPGA大赛选了实时语音识别方向,用高云GW5A系列FPGA部署一个轻量级Transformer模型做关键词唤醒。模型量化到INT8后,BRAM还是爆了,主要卡在自注意力层的中间结果存储。我们试过层融合把QKV投影合并成一个算子,但时序变差了。有没有人分享过实际调通的内存复用方案?比如用分布式RAM替代部分BRAM,或者把注意力矩阵分块计算?另外高云的EDA工具对内存优化支持怎么样,有没有类似Vivado的URAM可以映射?求具体可落地的策略,别光说理论。
电路玩家新手

电路玩家新手

这家伙真懒,几个字都不愿写!
237700
分享:
2026年,FPGA大赛备赛做实时人脸检测,用国产紫光同创FPGA,PDS开发环境比Vivado难用吗?新手怎么快速上手?上一篇
FPGA线上课程平台|最全栈的FPGA学习平台|FPGA工程师认证培训
还没有人回答,第一个参与下?
我要回答
回答被采纳奖励100个积分
FPGA线上课程平台|最全栈的FPGA学习平台|FPGA工程师认证培训
请先登录