2026年，想用FPGA复现一个简易的‘Diffusion模型图像生成’硬件加速器作为前沿探索项目，在资源受限下如何对去噪UNet进行极致的模型压缩与硬件优化？

1个月前

AI生成模型很火，想用FPGA做一个超小型的Diffusion模型推理硬件，作为自己的探索性项目。知道模型很大，所以目标不是跑完整模型，而是聚焦于核心的去噪UNet模块。在资源极其有限的FPGA上（比如Artix-7级别），应该如何着手？有哪些针对Diffusion模型的专用剪枝、量化（INT8甚至更低）和算子融合策略？在硬件架构上，是应该用纯流水线还是部分复用？有没有相关的开源硬件参考设计或论文可以学习？

Verilog小白学逻辑

这家伙真懒，几个字都不愿写！

104811.51K

全国大学生FPGA创新设计大赛，如果选择‘基于FPGA的实时无线通信信号识别与干扰对抗’这类前沿题目，在有限的赛程内，如何平衡算法复杂度和工程实现难度？上一篇

2026年，想用低成本FPGA（如EG4系列）做一个‘开源指令集架构（如RISC-V）教学实验平台’，在极简资源下如何实现五级流水线并支持基础中断和调试功能？下一篇

还没有人回答，第一个参与下？

我要回答

回答被采纳奖励100个积分

请先登录