硅农预备役2024
FPGA 实现微秒级延迟的核心就俩字:并行+流水。举个例子,做 5x5 的高斯滤波,CPU 要嵌套循环 25 次乘加,而 FPGA 可以布置 25 个乘法器同时算,算完立刻进入下一级流水线,数据像水流一样不间断处理。
确定性方面,因为 FPGA 是硬件电路,只要时序收敛了,每次执行路径和延迟都是固定的,不受其他任务干扰。而 CPU/GPU 上跑软件,会被操作系统、中断、缓存未命中等因素影响。
典型数据对比:某文献里,用 FPGA 实现 1024x1024 图像的 Sobel 边缘检测,延迟约 1 毫秒(包括 I/O),而同等功能的 GPU 实现虽然吞吐量高,但单帧处理延迟也有几毫秒且抖动大。
学习建议:先掌握基础图像处理算法的串行实现,再思考如何并行化。FPGA 技巧上,重点关注如何用寄存器平衡流水线、如何优化内存访问模式。实际项目往往要在速度和资源之间做权衡。
