【文/观察者网专栏作者 潘攻愚】
2015年3月19日,美国司法部在官方网站上发布了一则新闻稿:“旧金山一男子及其公司因向俄罗斯走私精密电子元件而被起诉。”
经查,已经入籍美国的俄罗斯裔Pavel Flider因通过第三方走私“受控的两用可编程计算机芯片”,涉案金额高达6000万美元而被旧金山联邦大陪审团起诉。
彼时,恰好是俄罗斯从乌克兰手中夺回克里米亚一周年。
以事后之见来看,克里米亚事件为七年后俄乌爆发全面军事冲突埋下了伏笔。可以说,Pavel Flider为俄罗斯储备了一批价值不菲的军用物资。
他所走私的6000万物品中,主要的品类是可编程计算机芯片即FPGA,号称“万能芯片”。在今天的俄乌战场上,FPGA甚至一度成为“战争芯片概念股”的主角。
根据好事者对战场遗址打扫和武器拆解,今年7月,在基辅Okhmatdit,俄罗斯Kh-101火箭的导航系统使用了Xilinx(赛灵思)的FPGA芯片;类似但更先进的FPGA也出现在“柳叶刀”无人机中。俄罗斯Iskander和Calibre-PL巡航导弹的导航中大量使用全球两大FPGA巨头Xilinx和Altera的产品。
从柳叶刀无人机上拆卸下来的Xilinx的FPGA
对俄罗斯抱有敌意的媒体Insider报道,号称俄高科技工业心脏的米克朗Mikron Group其产品型号中只有两种FPGA型号,不得不高度依赖进口。
在以美国为首的西方对俄罗斯半导体全面断供的情况下,俄方通过中亚等第三方中转站和之前的库存依然可以维持战争所需的“工业粮食”的周转。从2022年到2024年,即战争开始后的两年里,Xilinx和Altera流向俄罗斯的FPGA总价至少分别为2.16亿美元和1.2亿美元。
俄罗斯“特种技术中心”公司发布的FPGA工程师招聘信息
战争形态可以检验一国关键物资储备的生产力和动员力。战场上厮杀后的余烬往往埋藏着胜负手的解码器。AI大潮汹涌澎湃之下,看似处境有些尴尬的FPGA以战立身,在某种层面上可以迫使业界重新思考CPU、GPU、FPGA\ASIC这些高算力芯片在各类型产品价值链中的地位,以及探讨如何进一步优化军工半导体生态,提升相关供应链的健康度。
FPGA的坐标系:非中心,但也绝非边缘
何谓FPGA?Field Programmable Gate Array,即现场可编程门阵列。现场和可编程是其称谓的两个关键词。
先说可编程。通过非门、与非门、或非门的有序堆叠,FPGA可实现任意功能的数字电路,所有组合电路都有对应的真值表,FPGA的可编程逻辑块中的LUT(查找表,Look Up Table),可以完成任意组合电路的功能。
再说“现场”。FPGA底层逻辑运算单元的连线及逻辑布局没有固化,这可以使得客户在拿到芯片后,通过本地或者远程配置的现场实现自己符合需要的功能。
FPGA于1985年由Xilinx创始人Ross Freeman发明,至今约有40年历史。FPGA和CPU、GPU同属于大型数字芯片序列。
这里请注意,FPGA的可编程特性是特指它的硬件可编程,这是其区别于CPU和GPU的显著特性。
通过对FPGA原理架构的拆解我们可得知,只需要改变FPGA中LUT的掩码,FPGA就可以承载另一个电路的功能,而且能无限次的修改。FPGA内部往往由数十万个可编程逻辑块可以同时独立工作,有效解决时钟频率高低起伏的问题,特别适合大型并行计算的场景。
我们可以用数学上著名的戴德金数来看看FPGA的威力。
在普通笔记本电脑上计算第八个戴德金数需要八分钟,但计算第九个则需要数十万年。帕德博恩大学的计算机科学博士生Lenart Van Hirtum在FPGA超级计算机的帮助下,这个问题在五个月内就得到了解决。
从架构上看,FPGA相比CPU和GPU,在某些领域的应用有着无可比拟的优势。
CPU的一项重大任务就是负责任务调度,在处理多线程任务时,不可避免地出现任务越多算的越慢的现象,所以任务率越高时延越长,而FPGA由于在布局布线阶段不需要重排执行顺序和指令调度,其处理时延和利用率大小基本是无关的,因此,FPGA非常适合低时延、需要现场可编程的场景。
生成式AI带火了GPU,让英伟达这个卖铲人市值一路水涨船高。业界普遍认为,更适合并行计算的GPU在AI训练和推理方面的负载难以被替代,取代了CPU,坐上了通用高算力处理类型芯片的头把交椅。但是任凭英伟达CEO黄仁勋无论怎样变换话术兜售GPU“买的越多越省钱,买的越多越节能”,GPU的功耗依然是个大问题,因其无法很好地利用片上内存,需要频繁读取片外的DRAM。
被GPU吹上产业风口的HBM(高带宽内存)恰恰说明了GPU需要HBM这样一个需要被封装在一起的“外挂”。而FPGA整个算法无需存储外挂,整个算法可以在片上完成,特别适用于小样本推理和边缘计算。
问题来了,既然FPGA相较CPU和GPU都有相当鲜明的优点,为何在PC时代和移动通信时代都没能成为处理器的主角?
从市场规模角度也能看出端倪。2022年FPGA全球市场规模区区80多亿美元,中国区市场不到210亿人民币。FPGA的产品特性决定了它无法完成像CPU那样的更通用性的调度安排处理功能,也无法像GPU那样做到大规模并行计算和AI训练。
而且,FPGA的地盘正在越来越受到ASIC——特定用途集成电路的侵蚀。和CPU、GPU、FPGA相比,ASIC的通用性和灵活性最差,但主打一个专精、高效和低功耗。
诚然,FPGA因为“现场”可用,相比ASIC,FPGA无需等待三个月至一年的流片周期,上市时间短,对于消费电子这类竞争激烈、迭代迅速的行业尤其重要。但ASIC更符合AI时代这种scale law的大力出奇迹模式,因此在技术非常成熟且利润率非常低的产品是杀手般的存在,只要保证设计上的技术成熟,就可以抵消一次性量产带来的流片昂贵(ASIC因其硬件不可编程,流片失败意味着一批产品都要废掉)的问题,可以大规模上量,有着更低的功耗,更丰富的封装选择和更优的TCO(芯片设计、制造总成本)性价比。
从现实市场层面上也可以看到FPGA的命运之坎坷。
2015年,英特尔以167亿美元收购当时的FPGA领域龙头企业Altera,随后形成了现在的PSG部门。2022年,AMD宣布以全股份交易的方式,完成对最大FPGA厂商Xilinx的收购,按当时双方股票价格,交易金额达到350亿美元。
今年FPGA再次成为媒体热议的焦点,一大原因是因为英特尔决定拆分PSG部门,让Altera重新单飞上市。当年在FPGA市场呼风唤雨的Altera被CPU大佬呼来唤去,聚而终散,根本原因在于当年的“CPU+FPGA”异构整合计算的野望无法达成预期,在数据中心和云计算方面未能发挥强强联手的优势,最终以英伟达GPU大获全胜收场。
此外,由于Altera在紧跟摩尔定律方面裹足不前,10nm工艺以下平台被Xilinx稳稳碾压,五年来市场份额从超过40%掉到了24%左右。
即便如此,AMD收购Xilinx虽然整合程度高于英特尔,也未达到当年在数据中心市场上的全面预期。大局形势所迫,Xilinx目前已经不是一个纯FPGA公司,还提供很多板级服务,尤其是高集成的SoC产品以进一步增强客户黏性。
从整体市场前景上看,我们也必须认识到,在AI产业炸裂的时代,FPGA依然无法“挑班”运营,反而让ASIC乘势迅速崛起。
目前半导体行业形成了一个基本的共识,未来芯片设计将更加专业化,专用芯片ASIC会得到更广泛的部署与应用,目前对英伟达GPGPU通用计算平台挑战最大的就来自LPU/TPU,一个典型的例子就是谷歌的TPUv4集群已经广泛进入到超算行业,并且让苹果的AI项目抛弃了英伟达高端AI加速器而选择了谷歌TPU。
作为一种ASIC的TPU,没有不必要的逻辑和路由开销,逻辑控制单元更小、更容易设计,只占整体芯片面积的2%,给片上存储器留下了更多的空间。
总之,FPGA虽然在各个时代的风口都无法站在的舞台的最中央,但它却像一个可隐可现的,内力十足的江湖豪侠守住自己的一亩三分地。可现场重构、灵活性、快速迭代、低延时,以及适合某单一应用场景的小批量生产,等等均是它的杀手锏,这也是其战略地位的最佳表达。
还没有评论,来说两句吧...