FPGA诞生40年:穿越周期,如何成为不可替代的边缘AI王者?
今年,首款商用现场可编程门阵列(FPGA)迎来问世40周年。 1985年6月,赛灵思(现为 AMD 的一部分)联合创始人Ross Freeman发明了XC2064芯片,以“硬件可编程”理念开启了整个半导体设计的新篇章。 FPGA 对市场的影响是惊人的,催生了一个价值超过 100 亿美元的产业,推动了赛灵思、Altera、Lattice、Microchip等企业的发展。2022年,赛灵思被AMD收购后,更是成为其自适应和嵌入式计算事业部(AECG)的重要支柱。 过去四十年来,AMD已向不同细分市场的超过 7000 家客户交付了超过30亿颗FPGA和自适应SoC(结合FPGA架构与片上系统和其他处理引擎的器件)。事实上,AMD已连续25年位居可编程逻辑市场份额的领先地位。 AMD产品、软件和解决方案公司副总裁Kirk Saban是这一历程的亲历者,他深耕FPGA领域已经超过25年。日前,在FPGA创新40周年媒体沟通会上,他指出了现代FPGA的能力跃迁:“40年间,我们从基础LUT查找表演进至嵌入式处理、高速收发器、硬IP的融合,得以驾驭高性能复杂任务,FPGA已成长为支撑实时计算的核心基础设施。”

AMD产品、软件和解决方案公司副总裁 Kirk Saban
AI浪潮下的FPGA定位:边缘AI的不二之选
FPGA 给半导体产业带来的影响是深远的,它为工程师提供了随时更改芯片设计的自由和灵活性,以在一天内开发和设计出定制芯片的能力。FPGA 还助力开创了“无晶圆厂”商业模式,彻底改变了整个半导体行业。通过消除对定制掩膜加工和相关的非经常性工程成本的需求,FPGA 助力加速硬件创新,证明企业不需要拥有晶圆代工厂来打造突破性的硬件。 进入AI时代,FPGA将会扮演什么角色?Kirk Saban表示,FPGA是数据中心加速、边缘AI的不二之选,尤其是在实时处理、实时决策的刚性需求下。在边缘计算与AI领域,FPGA凭借实时处理能力和强自适应性占据独特优势,既能满足工业控制、自动驾驶等低时延、无法云上滞后处理的任务需求,又能根据不同应用场景调整,动态调整不同尺寸、功耗、价格及性能的平衡点。 随着越来越多的边缘侧智能器件实现部署,Kirk Saban认为,未来会有越来越多设备实现“万物互联”,而FPGA有着非常巨大的潜力和机会在这个领域继续发挥作用,这对FPGA来说将是一个非常重要的节点。 “FPGA拥有灵活的现场可编程、可升级能力,这是一个关键的价值主张”,他解释说,也正是得益于此,FPGA在边缘侧实现“AI算力按需部署”时将更具优势。 例如在医疗远程手术中,FPGA可同时处理影像实时渲染与机械臂控制,确保低时延与高可靠性;在工业物联网中,它能适配不同传感器协议,并根据生产流程变化重新配置数据处理路径;在汽车领域,现代新能源汽车如同“车轮上的电脑”,从ADAS到车载娱乐系统,FPGA正在成为电子架构中的关键节点。 为此,AMD在产品矩阵中既布局了最低功耗的Spartan UltraScale+,也有高性能的Virtex系列,可满足包括数据中心、汽车、测试测量与仿真、工业与视觉、医疗和科学、航空航天、广播与专业音视频在内的全场景需求。与此同时,AMD还有非常广泛的针对不同的功耗和性能需求的广泛产品。当客户选择了相应器件之后,如果还需要嵌入式的处理能力,就可以选择“Zynq 7000”和“Zynq MPSoC”产品线。
未来迭代:Chiplet与异构集成的进化,构建一体化AI软件框架
FPGA未来的技术将如何演进? Kirk Saban指出,首先是进一步SoC化,整合更多硬核IP 如以太网核、安全核等;其次,Chiplet是一个重要方向,这方面AMD继承了2011年起源于台积电Virtex-7的创新基因,将其广泛应用于现代GPU、FPGA中。这种技术路线不仅能降低先进制程的成本压力,更能通过异构集成释放FPGA的灵活计算潜力。 在开发工具方面,Vivado、Vitis将持续更迭,不断提升产品易用性,降低开发门槛、提高开发效率。 其中,Vivado软件侧重于硬件开发人员,通过高层次综合、机器学习优化和无缝IP核集成等高级功能,支持开发人员简化工作流程、缩短开发周期并实现更高的性能。 面向软件开发流程的Vitis开发环境带来了预优化的工具和抽象层,以助力加速AI推理。最新版本(2024.2)包含多项新功能,例如,面向嵌入式C/C++设计的独立工具,以及简化搭载AI引擎的AMD Versal自适应SoC的使用的增强功能,算法工程师无需深入硬件细节即可开发相关应用。 “这些工具形成了很多的合力,我们致力于持续投入,令用户工作更加高效,同时能够利用新的和日益演进的数据类型与AI模型。”Kirk Saban认为,Vivado与Vitis双工具链体系实现了与AMD CPU、GPU的软件栈协同,从而能够在一体化的AI软件框架之下进行开发,这可以更好地助力客户在AMD硬件上训练模型和进行推理部署。 构建一体化软件框架的主要意义是什么?在他看来,核心优势在于将适配的神经网络处理器与可编程逻辑块深度整合,通过Versal系列产品的AI引擎硬件及灵活逻辑架构,实现NPU与各类模型的精准匹配,为客户提供兼具算力效率与架构灵活性的解决方案。
全栈优势下,FPGA如何全方位重塑产业逻辑?
2022年2月14日,AMD顺利完成了对赛灵思的并购,并由此构建了包括CPU、GPU、FPGA在内的多元化的计算产品矩阵。这种全栈计算能力使AMD能够精准匹配不同市场的差异化需求——从云端大规模训练到边缘实时推理,从高性能计算到低功耗应用,AMD均可凭借丰富的产品组合,为客户提供适配其算力需求的最优芯片解决方案,助力解决复杂计算场景下的技术挑战。 在这一背景下,FPGA也在异构组合方案中实现了产业价值重定位——凭借自适应计算能力,在算法快速迭代的AI时代弥合硬件代沟。面临AI工作负载的爆发,AMD更为重视AI软件的能力,不断开发AI编译器技术应用于FPGA中。并且,AMD在软件领域的投资在不断加大,这包括一些重要的并购(例如Mipsology),不断地打磨和增强AI软件生态的建设,充分释放硬件潜能。 “我们已经在探索AI助理在开发工具中的应用,这将是提升生产力的下一个突破口。”Kirk Saban透露,AMD正在将生成式AI技术融入FPGA开发流程,让复杂的硬件编程变得更加智能。 在生态建设上,AMD同样呈现出开放姿态。通过与Yocto项目合作、向开源社区贡献源代码,以及推动ROCm在GPU软件领域的开源生态,AMD正在构建跨硬件平台的开发者生态。 “开源不仅能加速开发效率,更能确保我们的工具链具备世界级的鲁棒性。”Kirk Saban强调,这种策略在边缘智能时代尤为重要——当开发者需要快速适配传感器接口、通信协议等定制化需求时,开源社区的资源能大幅缩短创新周期。 随着FPGA、CPU、GPU、ASIC等多种计算引擎被用于边缘智能场景,AMD将如何帮助开发者充分利用底层硬件的功能?Kirk Saban回应称,“这其实就需要考虑系统级的设计,以及如何充分利用器件所具有的存储架构来实现最大的潜能。”而FPGA非常独特的亮点之一,就是它拥有独特的“定制化存储架构”,使得客户能够在该架构基础上进行差异化设计。同时,合适的软件开发工具、库、辅助设计环境也很关键,客户能够将自己的模型在AMD硬件基础之上进行编译。
写在最后
四十年技术周期更迭,FPGA从实验室的革命性构想,成长为智能世界的关键支柱。究其穿越周期的核心密码,其实仍藏于“硬件可编程”的原始基因中。站在自适应计算与边缘AI爆发的拐点,这颗曾改变ASIC游戏规则的芯片,正以动态重构之力开启AI时代的新征程。 当算力需求从数据中心涌向边缘,当AI模型迭代速度超越摩尔定律,唯有可动态适应和重构的架构能化解“算法进化与硬件固化”的根本矛盾。未来,FPGA灵活的计算能力将继续革新智能产业,提供与时俱进的硬件底座,成为各行各业都不可或缺的基础设施。