告别英伟达时代?FPGA技术突围,2026年AI芯片大战一触即发!
一家叫Positron的初创公司最近拿到了5160万美元融资,他们要做专门跑AI模型的芯片。创始人团队2023年才成立公司,用1250万美元种子轮资金做出了第一代产品Atlas,现在第二代产品计划2026年上市。这家小公司说要挑战英伟达的GPU垄断,声称自己芯片的内存效率比对方高3倍,功耗却低三分之二。
Positron的CEO Agrawal说他们做芯片是为了让AI模型跑得更便宜。他们设计的系统能在单台机器里运行参数量16万亿的模型,这比现在大部分AI服务器能处理的模型大得多。他们给客户算过账,用他们的设备每生成一个AI回复的花费比用英伟达GPU低很多,而且不需要担心芯片缺货问题。

公司技术核心是FPGA芯片。这种芯片不像GPU那样固定功能,能随时调整运算方式。Positron用FPGA做了个叫Atlas的盒子,里面装了四块特殊芯片,客户可以直接拿开源模型来用,不需要改代码。他们最近卖出了价值几百万美元的设备,现在有20个潜在客户在测试。
英伟达的GPU现在是AI训练和推理的主流选择,但问题不少。Agrawal团队抱怨说用GPU太耗电,内存不够用,而且英伟达芯片经常缺货。他们自己测试发现,Atlas跑一个叫Llama3的模型时,每瓦特电能生成280个文字单位,而英伟达的DGX系统只能出180个,耗电却是三倍。
Positron现在用的FPGA芯片是英特尔的,但未来要自己做ASIC专用芯片。他们说FPGA虽然性能不如ASIC,但能快速改功能,等确定技术路线再研发ASIC更稳妥。CEO Sohmers解释说很多AI芯片公司失败是因为花了太久研发ASIC却没人买,他们想先用FPGA验证市场。

Atlas机器是个四层机箱,里面四块FPGA芯片连着高速内存。他们最新的设计能把同样功能压缩到两层机箱,内存容量还能再扩大。技术团队说他们优化了芯片内部的数据传输路径,让内存利用率超过90%,而GPU通常只能到30%。
现在Positron的客户主要是中小型云服务商和企业。这些客户不想被英伟达绑定,但又需要处理大模型。有公司用Atlas跑了视频生成模型,发现耗电量只有之前GPU方案的三分之一。不过他们承认这些数据需要第三方验证,现在主要靠客户自己测试。

英伟达垄断带来的问题不只是贵。很多AI公司抱怨GPU算力不够用,训练大模型要排队等资源。Positron说他们的系统能同时服务更多用户,比如一个Atlas机器可以同时处理多个长对话,而GPU可能只能做单一任务。
他们计划2026年推出的ASIC芯片会更省电,但具体性能参数还没公布。现在用FPGA已经能做到单芯片连接2TB内存,这比大部分GPU的内存容量大很多。技术团队透露ASIC会把运算单元和内存连接得更紧密,减少数据搬运时间。

Positron的客户包括一些做AI客服和游戏公司的客户。有客户说Atlas设备安装简单,插上电接上网线就能用,而GPU服务器需要复杂配置。但也有客户担心FPGA的计算速度不如GPU,尤其在需要大量浮点运算的任务上。
公司目前主要卖硬件盒子,但也在开发配套软件。他们做了个系统让客户直接从模型库下载模型,自动适配到自己的芯片上。有技术博客测试发现,用Positron设备跑模型确实不用改代码,而英伟达的系统有时需要重写部分程序。

英伟达最近也在推新芯片,比如H200,号称能解决内存瓶颈。但Positron团队认为这些改进不够,因为GPU架构从根本上受限于内存带宽。他们展示的测试数据显示,Atlas在处理超长对话时,能同时处理更多用户请求,延迟更低。
现在的问题是Positron的测试数据都是自己做的,第三方还没验证。有行业分析师说要等更多客户公开对比结果才能下结论。不过他们快速迭代FPGA芯片的能力确实让投资人放心,最近一轮融资超额完成。

Positron的办公室墙上贴着标语:“让超级智能触手可及”。他们说开源模型应该用更便宜的方式运行,而不是被高价GPU锁死。现在已经有开源社区在测试他们的设备,讨论区里有人说确实省了不少电费,但也有人抱怨驱动程序不够稳定。

未来两年是关键。如果2026年ASIC芯片能按计划推出,且性能真如宣传,那英伟达的垄断可能会被打破。但芯片研发风险大,之前不少公司跳票过。Positron选择先用FPGA站稳市场,等ASIC出来再扩大优势,这可能是他们活下去的策略。