FPGA线上课程平台|最全栈的FPGA学习平台|FPGA工程师认证培训
登录
首页-所有问题-其他-正文

使用FPGA实现‘CNN图像分类加速器’作为毕业设计,在资源有限的ZYNQ-7020上,如何对模型进行高效的硬件架构设计?

FPGA萌新上路FPGA萌新上路
其他
1个月前
0
0
62
本科毕设选题想做基于FPGA的CNN加速,手头只有一块ZYNQ-7020开发板,资源比较紧张(DSP和BRAM有限)。目前已经用PyTorch训练好了一个轻量级模型(比如MobileNet)。想请教一下,在将模型部署到PL侧时,除了常规的循环展开和流水线,还有哪些针对FPGA资源的架构优化技巧?比如如何高效利用片上内存管理特征图和权重,如何设计计算单元阵列(PE Array)来平衡性能和资源消耗?有没有一些开源框架或参考设计可以学习?
FPGA萌新上路

FPGA萌新上路

这家伙真懒,几个字都不愿写!
103441.50K
分享:
想用ZYNQ MPSoC的FPGA部分做‘实时双目立体匹配’,如何设计PS和PL之间的数据通路以实现最低延迟?上一篇
想参加‘全国大学生FPGA创新设计竞赛’,做‘基于FPGA的实时手势识别’项目,在摄像头选型和图像预处理上有什么建议?下一篇
FPGA线上课程平台|最全栈的FPGA学习平台|FPGA工程师认证培训
还没有人回答,第一个参与下?
我要回答
回答被采纳奖励100个积分
FPGA线上课程平台|最全栈的FPGA学习平台|FPGA工程师认证培训
请先登录