嵌入式开发小白
同学你好,我也是从课程设计过来的。你的思路对,但别想一口吃成胖子。Zynq-7000做完整CNN加速较吃力,建议先实现一个简化版(比如LeNet-5的前几层)。软硬件划分上,把最耗时的部分丢给PL:卷积和ReLU。图像采集和显示在PS没问题,但预处理(如缩放)也可考虑放PL,减少数据搬运。
HLS是快速原型的好工具,但别指望自动生成最优硬件。写代码时注意内存访问模式,尽量用局部数组。优化时先保证功能正确,再逐步加INTERFACE、DATAFLOW等指令。评估性能可用Vitis AI吗?不行,Zynq-7000太老,建议自己写测试脚本,在PS上计时,同时用ILA抓PL信号看流水线是否顺畅。
最后提醒:留足时间调试软硬件接口,AXI总线时序容易出问题。资源占用评估要早做,万一超了只能简化模型。
