文 观察者网心智观察所
2月25日,特斯拉宣布推出城市道路Autopilot自动辅助驾驶功能,此举标志着备受期待的全自动驾驶FSD功能正式进入中国市场,特斯拉为中国客户分批次更新软件。本次特斯拉FSD在中国的版本包括交通信号识别、导航辅助、智能变道等功能,同时摄像头还可识别驾驶员注意力情况。
随着驾驶辅助技术在中国越来越普遍,特斯拉FSD正式入华,也为中国智驾竞赛添了一把火。
比亚迪、小鹏等国产品牌已经推出了各自的高阶智驾系统,如比亚迪的"天神之眼"和小鹏计划推出的L3级自动驾驶。特斯拉的加入将进一步刺激技术创新,推动整个行业向更高级别的自动驾驶迈进。
心智观察所将在本文中,带你回顾总结影响中美自动驾驶竞争的关键技术和政策因素。
为什么自动驾驶难如登天?
想象这样一个场景:一群由工程师、业余爱好者和发明家组成的"杂牌军",带着他们自制的自动驾驶机器,来到美国南加州干旱的莫哈韦沙漠。他们的目标是让这些"钢铁司机"完成150英里(约241公里)的赛道,赢取100万美元奖金。但最终无人成功——表现最好的卡内基梅隆大学团队,他们的机器也仅跑了7.4英里便败下阵来。
这是2004年由美国国防部高级研究计划局(DARPA)发起的自动驾驶挑战赛。尽管当时的技术尚显稚嫩,DARPA的尝试绝非徒劳——当年卡内基梅隆团队的两名成员,后来成为谷歌旗下Waymo的创始人,而如今Waymo已是自动驾驶领域的领头羊。
20年过去,自动驾驶仍未迎来类似ChatGPT的"开窍时刻",更多时候仍像是张未兑现的支票。但两种技术路线的激烈竞争,为这个领域注入了新的活力。
如果说将AI植入聊天机器人是技术革命,那么自动驾驶将是改变人类生活方式的"工业革命"。从技术层面看,它是通向机器人时代的钥匙;从经济角度看,它能让人类从方向盘前解放。
以美国为例,自动驾驶将每年为美国劳动者节省240亿小时——相当于每人多出整整12天假期。这些时间可以转化为亲子陪伴、工作产出,或是单纯的放松休憩。
为什么自动驾驶难如登天?
真正的完全自动驾驶,意味着车辆能在任何路况下自主行驶,这需要同时解决两大难题:既要造出媲美人眼的"视觉系统"(通过摄像头和传感器),又要复刻人类大脑的"驾驶本能"(依赖深度神经网络)。
想象日常驾驶场景:要瞬间判断侧方卡车的行驶轨迹,要识别暴雨中突然窜出的孩童,要在0.3秒内完成刹车反应——这些对人类而言近乎本能的判断,对机器却是需要精密计算的系统工程。更棘手的是,自动驾驶必须建立绝对安全的社会信任:它能否在机场的车流中游刃有余?又能否应对街头混乱的交通生态?
即便困难重重,这项技术的商业前景依然诱人。根据美国智库的一项研究:到2035年,仅客运领域就能创造4000亿美元收入,更将释放数万亿美元的社会效益——美国若能普及25%的自动驾驶车辆,预计可避免144万起事故,节省数十亿美元医疗开支。
双雄争霸:模块化VS端到端
未来好像还挺远?但无人驾驶这事儿其实已经快摸到门槛了!现在有两个门派在较劲:一个是Waymo的"积木搭房子",也就是模块化的路线,另一个是特斯拉的"一口闷"大法,专业说法就是端到端——这俩都靠最近爆红的变形金刚,哦不,Transformer模型撑腰。
先说"积木派",就像流水线工人分工干活。比如用三个Transformer:一个当眼睛看路况,一个当大脑规划路线,第三个当手脚控制油门刹车。每个机器人各司其职,工程师们可以挨个调教优化,哪里坏了修哪里。不过有意思的是,本来想简化问题,结果搞出一堆流程反而更麻烦了。
再看特斯拉的"一口闷"派,直接让一个Transformer大胃王吃下所有数据。摄像头拍啥它就看啥,方向盘油门刹车它全包,就像人类开车一样边开边学。这种路子倒是更接近咱们学车的过程——多开几次就会了。
这俩门派用的Transformer模型,和你们天天聊天的ChatGPT、DeepSeek其实是亲戚。不过人家不是处理文字,是专门处理视觉信息的超级视觉家!比传统图像处理技术更擅长分析摄像头画面、激光雷达这些复杂数据,就像给车装了24K钛合金狗眼。
现在整个行业都赌疯了:只要给这些视觉模型喂够数据和算力,自动驾驶就能突飞猛进。不过这里有个要命的问题——车载电脑得够强!手机上的聊天AI可以靠云端服务器,但自动驾驶必须自己车上就能实时处理,毕竟生死就在0.5秒之间。
举个吓人的例子:8个高清摄像头拍30帧视频,开一小时能存满4000张DVD!Waymo要是派40辆车上路,一天产生的数据量就能塞满整个美国国会图书馆。车载电脑得用特制芯片才能扛住这种数据洪流,还不能有半秒卡顿——毕竟刹车晚0.1秒可能就是人命关天。
Waymo还是特斯拉的路线?
两大自动驾驶领域的竞争对手,Waymo 和特斯拉,正铆足了劲儿想证明自己那套方法靠谱。
Waymo 呢,正在优化它的模块化架构,这玩意儿因为透明度和可信度高,得到了监管机构的点赞。可与此同时,特斯拉可是拼了老命在用它工程师觉得能更快、更好出结果的端到端方法,哪怕这得牺牲点透明度。
要是系统出岔子,Waymo 的系统能进行详细验证和错误追踪。不过,这架构是基于模块的,调整一个模块,其他模块都得跟着重新校准,确保一致性和兼容性,这过程可就麻烦多了,而且在自动驾驶长远发展里,还可能拖慢最新 AI 技术整合的速度。
但特斯拉的端到端方法就厉害了,它靠一个集成的神经网络,能更快地推动自动驾驶进步。在大量特定场景驾驶数据上训练后,对罕见或不规则事件(像给闯红灯的救护车让路)能有更好的反应。
两种模型都有优点,还不少地方重叠。不过,端到端模型因为本身灵活,看着更有前景。而且特斯拉有个厉害的规模优势,它有好几百万辆自家车,能部署自动驾驶功能收集实时数据。只要能跨过计算和数据的坎儿,这就能让特斯拉在自动驾驶领域大步往前走。
就说特斯拉的最新软件更新吧。靠着端到端方法,它的全自动驾驶 12.3 版本比之前版本能力上提升不少,进一步证明了端到端方法在推动自动驾驶前沿方面的潜力。
这事儿行业竞争对手,尤其是中国的参与者,都瞧在眼里。像理想汽车、蔚来、小米和华为这些公司,都赶紧重组自动驾驶部门,纷纷用上端到端模型。就连 Waymo 也开始搞对冲策略,发布新研究,探索更早整合端到端方法。
虽说 Waymo 有先发优势和稳稳当当的运营记录,但特斯拉的最新进展表明,它可能成为自动驾驶领域进展的主要风向标。可就算明天就实现完全自动驾驶,它的可扩展性和商业化还得看成本。要是每辆车成本高达 10 万美元,那无人驾驶出租车车队这最明显的自动驾驶用例就没戏了。所以,自动驾驶技术栈(硬件组件和软件复杂集成)在性能和成本之间找到平衡至关重要。
自动驾驶(AD)公司正争先恐后地塑造商业化机会,这得靠开发有成本效益和可扩展性的自动驾驶技术栈。这些技术栈分三个关键部分:传感器、车载处理器和数据中心。在每个部分里,公司都会激烈竞争抢市场份额。结果呢,会形成一个蓬勃发展的新汽车工业供应商生态系统,有些是调整后的传统供应商,有些是新入局的。
到目前为止,世界上最成熟的自动驾驶供应商生态系统就在美国和中国。说到商业可行性,自动驾驶可不只是 Waymo 和特斯拉的竞争,中国的百度和华为也得算上。你看,百度就推出了售价 3 万美元的 RT6 无人驾驶出租车,这很大程度上得益于中国有成本效益的供应链。而且,中国和美国一样,有不少汽车公司想部署自动驾驶。
事实上,无人驾驶出租车车队是最明显的自动驾驶商业模式,已经在奥斯汀和武汉等城市地区部署。这就意味着,竞赛正在进行,得确保最佳的自动驾驶技术栈,这可是成功大规模商业化的先决条件。
自动驾驶:激光雷达的去留之争
接下来聊聊自动驾驶汽车的感知系统,这玩意儿就像是汽车的“眼睛”和“耳朵”,主要靠三种传感器硬件来“看”和“听”:摄像头、激光雷达和毫米波雷达。举个例子,Waymo 的第六代无人驾驶出租车,那配置简直就像“堆料狂魔”,装了 13 个摄像头、4 个激光雷达、6 个毫米波雷达,还有一组外部音频接收器。这种“堆料”式的传感器配置,在其他自动驾驶公司里也挺常见的,尤其在中国市场的竞争对手们,好像传感器越多就越厉害似的。
但特斯拉这家伙就是个“异类”,它坚持采用以摄像头为中心的方案。2023 年,中国研究人员发表的一篇论文还给特斯拉这做法“站台”了。论文说,一种叫 BEVFormer(鸟瞰图 + Transformer)的自动驾驶模型,光靠摄像头就能生成用于路线规划的鸟瞰图,厉害吧!
虽说自 2019 年以来,激光雷达的价格已经降了不少,但特斯拉还是死磕以摄像头为核心的端到端自动驾驶系统。在其全自动驾驶(FSD)硬件里,根本就没激光雷达的影子。埃隆·马斯克这人好像觉得,激光雷达对自动驾驶来说,就是个“累赘”而不是“帮手”。因为它没提供足够大的性能提升,来证明自己存在的价值,反而还增加了 FSD 数据引擎的复杂性,简直就是个“麻烦精”。
如果特斯拉这一策略最后真成了,甚至硬生生地拉着整个行业不情愿地跟着走,那本来就已经挺惨的激光雷达行业,估计得更难受了。全球市场老大禾赛科技,还有美国的 Ouster 和 Luminar 等公司,它们的股价跟 2023 年初比,都跌了 50% 以上,简直就像坐了“过山车”。只有禾赛科技还保持着正的运营现金流,但这也顶不住啊,因为国内的中国玩家,比如华为,越来越多地学特斯拉的做法。就像华为2024年推出的 ADS 3.0 软件,直接就把激光雷达给“砍”了,还把六个毫米波雷达也给“开除”了。
再看看韩国的巨头三星和 LG,它们作为特斯拉的高清摄像头供应商,现在混得挺不错。这得益于它们之前为智能手机供应链精心打造的成熟摄像头技术,就像 LG 给苹果的 iPhone 供应摄像头模块。虽然中国公司在摄像头图像传感器组件的国产化方面有点进展,但还没从韩国供应商手里抢走多少市场份额。同时,它们还得面对来自美国和欧洲一级供应商,比如采埃孚、博世和大陆集团的激烈竞争,压力山大啊。
在雷达领域,这是三种自动驾驶传感器类型里最大的市场,毫米波(mmWave)因为更耐用的性能和更远的探测范围(能达到好几百米),把超声波给“比下去”了。Waymo 和特斯拉在它们最新的自动驾驶架构里,都只用毫米波雷达,这可让中国供应商看到了机会,想借这机会缩小差距,跟国外巨头掰掰手腕。
随着自动驾驶技术不停地发展,最佳传感器套件也会不停地变,就是为了在性能和成本之间找到那个“平衡点”。这些传感器还生成了海量数据,这也引发了自动驾驶技术栈里另一个关键组件的竞争:车载芯片,大家都想在这块“蛋糕”上分一块。
自动驾驶芯片:买现成的还是自己造?
传感器就像是汽车的“眼睛”,负责接收外部环境的视觉信息,但光有“眼睛”可不够,还得有车载芯片这个“大脑”来处理每小时数 TB 的海量数据。这些多功能系统级芯片(SoCs),那可厉害了,把核心 GPU、AI 加速器和 CPU 内核都集成在一块儿,全部实现实时处理,就跟咱们人看到东西立刻就能反应过来似的。
现在竞争的芯片供应商都在盯着两个关键标准:效率和延迟。对于自动驾驶汽车来说,能效那可是比数据中心的 GPU 还重要。为啥呢?因为自动驾驶汽车未来大概率是全电动的,自动驾驶系统全靠电池供电。你想啊,如果自动驾驶系统每小时就把电池电量消耗掉 15% 到 20%,那整个汽车都得重新设计,得装更大的电池组,这多麻烦啊!延迟也很关键,为了打造安全的自动驾驶系统,从视觉输入到处理成响应的时间,得跟人类反应时间一样快,甚至还得更快,不然遇到紧急情况可就危险了。
所以说,搞出一个在性能和能效方面都超棒的自动驾驶 SoC,那就是自动驾驶硬件和软件集成挑战的核心。自动驾驶芯片一般都是为特定软件架构量身定制的。所以啊,那些既有芯片设计能力又有相关人才的公司就占优势了,因为它们从硬件到驾驶体验都能掌控得更全面。
这正是 Waymo 和特斯拉走的路子,这样能让它们在系统级别更好地控制创新,优化软件和芯片之间的互动。而且它们还能更好地把芯片设计时间表跟自动驾驶产品周期的其他部分对上,这就是它们相对于现成芯片供应商的关键优势之一。
但自己搞 SoC 开发成本可高了,技术上也超出了大多数自动驾驶公司(包括汽车制造商和自动驾驶卡车初创公司)的能力范围,所以它们只能依赖第三方 SoC 供应商。而且客户的自动驾驶软件架构还在不断变化,第三方供应商就得赶紧跟上,不能还想着用那种“一刀切”的解决方案。
对于这些供应商来说,敏捷性太重要了。它们能不能迅速迭代、跟上客户快速变化和特定需求,这比它们芯片现在的能力还更能说明问题。
按这个标准来看,中国的地平线公司和美国的高通公司好像走在前面了。这俩都是自动驾驶 SoC 领域的后来者,但高通自 2022 年以来在给宝马和梅赛德斯 - 奔驰等公司供应芯片方面可是取得了大胜利,还吹嘘它的汽车芯片 pipeline 值得超过 300 亿美元呢。
英伟达在 SoC 市场的强势地位,很大程度上得归功于它的先发优势(它首个自动驾驶解决方案可是 2015 年就在 CES 上发布了)。但它属于自动驾驶芯片的现成供应商类别,因为它的 GPU 并不是天然针对车载处理优化的。英伟达在自动驾驶领域可能有点挣扎,这从它 2022 年取消了 Atlan 自动驾驶芯片,而且到现在已经两次推迟下一代 Thor 芯片就能看出来。另外,英伟达从 2023 年下半年开始在中国市场份额输给地平线公司了,它为了应对,还开始在中国针对自动驾驶工程师搞招聘狂欢。
虽然美国和中国都有成功的自动驾驶芯片供应商冒出来,但在自动驾驶供应链的下一层 —— 超级计算的竞争中,天平可能要倾向于某一方了。
数据中心:自动驾驶技术最后的关键
无论是在旧金山、奥斯汀、武汉还是北京,无人驾驶出租车都还处在试点阶段。这些自动驾驶公司的迅速扩张,对它们的技术核心——数据中心,提出了更高的要求。这些数据中心,远离车辆行驶的地方,却肩负着处理随自动驾驶汽车数量增加而不断膨胀的数据量的重任。
强大的视觉语言模型(VLMs)对自动驾驶技术的扩展至关重要。有了它们,无人驾驶出租车就能在任何道路、任何条件下自如行驶,而不再像Waymo那样仅限于预设区域。这也是为什么特斯拉对计算能力有着极大的需求。它需要不断处理数百万辆已经安装了FSD软件的车辆收集到的驾驶数据,以提升自动驾驶性能。
特斯拉在德克萨斯州奥斯汀的Dojo项目,是一个人工智能超级计算集群。马斯克表示,这个项目的计算能力将达到100 EFLOPS,这得益于数百亿美元的投资,其中包括购买了相当于9万个英伟达H100 GPU。一旦达到预期,Dojo的计算能力将远超中国的自动驾驶领域领导者,如华为、小鹏和蔚来。它们分别通过云服务提供3.5 EFLOPS、8 EFLOPS和1.4 EFLOPS的计算能力。
然而,计算访问受限只是自动驾驶行业面临的地缘政治难题之一。中国和美国作为世界上最大的两个汽车市场,自动驾驶公司在这两个市场中都面临着重大的监管障碍。汽车的未来常被比喻为“车轮上的智能手机”,但实际上,自动驾驶技术的发展正越来越多地受到安全化和国家化视角的影响。
与受益于中美深度融合的智能手机不同,自动驾驶领域的中美合作面临着数据安全、供应链完整性和监管制度等棘手问题。这些问题阻止了中美自动驾驶市场像消费电子领域那样形成一个相互依赖的市场。
尽管如此,中国目前的能力已经足以在自动驾驶领域独立发展。它拥有强大的电动汽车行业、制造生态系统和丰富的人工智能人才。因此,自动驾驶很可能会同时成为“中国制造”和“美国制造”的代表。竞争的关键在于谁能在国内更快部署、在全球更快扩展,并拥有更好、更安全的产品。
自动驾驶系统需要不断获取大量数据才能安全行驶。这些装满轮子的机器人上的摄像头和传感器每天收集的数据量惊人,且可能具有敏感性。例如,当自动驾驶汽车驶入高度安全的军事设施或政府大院时,它会拍摄到这些地点的视频。这些视频数据的最终存储地点就显得尤为重要。
此外,每个自动驾驶公司都有自己的软件来运行整个车队,这使得公司成为防止故障和黑客攻击的唯一保障。因此,一个值得信赖的公司至关重要。鉴于美国和中国之间缺乏信任,双方都不愿意把自动驾驶汽车的控制权交给对方的公司。
这一点在拜登政府关于互联车辆的最终规则中得到了体现,该规则明确限制了中国自动驾驶玩家进入美国市场。同时,中国方面多年来也对在美国市场运营持谨慎态度。例如,中国无人驾驶出租车公司小马智行在2021年退出了加利福尼亚,此前其测试许可证被吊销,其美国业务对公司收入的贡献已经可以忽略不计。
特斯拉成为了两个最大自动驾驶市场是否能够建立联系的唯一测试案例。尽管该公司努力遵守中国的数据本地化要求,但特斯拉仍未获得中国监管机构对其最新全自动驾驶(FSD)软件的部署批准。本次特斯拉软件更新不同于美国的FSD功能,不能实现完全自动驾驶,特斯拉目前还在进行进一步技术测试和论证,未来将对中国智能辅助驾驶功能不断优化升级。
据推测,症结之一在于特斯拉希望在哪里训练其FSD数据。虽然可以在像奥斯汀或孟菲斯这样的地方的超级计算集群进行训练,但中国法律要求在本国境内处理多模态驾驶数据。这使得特斯拉陷入了一个两难境地:是在计算能力优越但数据资源较差的中国境外训练,还是在数据资源优越但计算能力较差的中国境内训练。
特斯拉的困境反映了监管机构对数据安全的真正担忧。然而,一旦获得批准,这无疑将大幅提升特斯拉的估值,因为中国是其在美国以外最重要的市场。
影响中美自动驾驶竞争的政策因素
在中国,自动驾驶技术的部署正以前所未有的速度推进,引领着全球自动驾驶的发展潮流。自2020年初,工业和信息化部联合其他机构发布了支持自动驾驶的指导方针,将这一领域视为战略性新兴产业以来,中国政府对自动驾驶的支持从未停歇。
高层政策的推动迅速转化为实际行动。2023年12月,中国的交通运输部和工业和信息化部共同发布了无人驾驶出租车的国家审批框架,为这一新兴行业设立了明确的准入标准。为确保安全,框架要求无人驾驶出租车服务提供商必须具备应急响应能力,满足保险要求,并明确自动驾驶的使用场景。此外,每三辆无人驾驶出租车还需至少配备一名人类远程安全控制器。北京、武汉、广州等地方政府也积极响应,根据国家框架制定了各自的政策。
相比之下,美国的自动驾驶行业面临着更为复杂的监管环境。由于联邦制监管审批系统的存在,自动驾驶公司需要在各州分别获得批准,而各州对无人驾驶出租车运营商的要求各不相同。这种碎片化的监管体系大大增加了自动驾驶公司的合规成本。例如,在内华达州,自动驾驶汽车需要具备断开自动驾驶系统的能力;在纽约州,自动驾驶测试只能在州警察的监督下进行;而在德克萨斯州,所有自动驾驶汽车内都必须安装记录设备。更令人惊讶的是,美国有十几个州甚至尚未建立审批流程或出台任何相关立法。
然而,在美国政府层面,也在酝酿着监管变革。新任交通部长肖恩·达菲在确认听证会上谴责了当前各州临时性法规的拼凑现象,并承诺将在国家层面建立更清晰的规则。同时,自动驾驶行业也希望美国国家公路交通安全管理局(NHTSA)能够取消对无人驾驶出租车车队的车辆数量限制——这一门槛目前尚无运营商能够达到。
尽管如此,美国自动驾驶巨头特斯拉仍然对中国市场充满了渴望。一旦获得中国自动驾驶政策的批准,特斯拉将能够进入这个拥有14亿潜在乘客的庞大市场。事实上,中国国内供应商已经抢占先机,自自动驾驶技术起步以来,中国已有大约20个城市开展了无人驾驶出租车服务,其扩展速度远远超过了美国。
以百度阿波罗为例,截至2024年7月,它在中国已经完成了超过700万次无人驾驶出租车行程,远超美国Waymo的500万次。随着更多国内供应商获得运营许可,这一差距还将进一步扩大。中国的自动驾驶行业正以前所未有的速度向前迈进,引领着全球自动驾驶技术的创新与发展。
缺魂少芯?我们将建设高速公路!
在自动驾驶技术的浪潮中,算力限制成为了中国公司发展视觉语言模型的一大挑战,而这些模型对自动驾驶系统至关重要。然而,中国并没有因此止步,反而找到了一个创新的解决方案——建设智能高速公路。
这可不是普通的高速公路,它们是专为自动驾驶时代设计的,路面下布满了传感器,仿佛为自动驾驶汽车铺设了一张无形的通信网。想象一下,当前方一公里处发生追尾事故时,所有行驶在这条路上的汽车都能瞬间接收到提醒,这样的安全保障无疑让人倍感安心。而且,这些智能高速公路并非自动驾驶汽车的专属,传统汽车同样可以在上面行驶,享受这份安全优势。
自2023年交通运输部发布建设智能高速公路的指导意见以来,中国在这方面可谓动作频频。如今,全国已有26个城市的17个智能高速公路自动驾驶测试区,划定了超过32,000公里的路段,并安装了8,700个路边传感器单元,这样的建设速度令人惊叹。
那么,这些汽车和路边传感器是如何进行“沟通”的呢?答案就是无线电波,而这背后则涉及到频谱分配的问题。在美国,一些系统还在使用较为老旧的专用短程通信(DSRC)技术,但中国则选择了基于5G的更先进、更现代的蜂窝车辆-万物互联(C-V2X)系统。自2020年自动驾驶发展初期,C-V2X系统就被视为重点,它也是中国大规模5G建设首批看得见的成果之一。中国汽车制造商也积极响应,已将C-V2X兼容性融入到车辆中,预计未来几年,兼容车辆的比例将大幅提升。
智能高速公路的建设,不仅为自动驾驶汽车提供了更为安全的行驶环境,也给中国的无人驾驶出租车运营商带来了独特的竞争优势。然而,任何事物都有两面性,智能高速公路也可能带来潜在的安全漏洞。尽管如此,中国仍在不断探索和利用这一新兴技术,如广东省就推出了一项新协议,利用互联高速公路在广州、深圳、珠海和澳门之间开展城际无人驾驶出租车运营。
与此相对的是,美国的自动驾驶领先者Waymo却显得相对保守,甚至限制其无人驾驶出租车在高速公路上行驶。这再次凸显了中美在自动驾驶发展道路上的不同选择。中国凭借其在基础设施建设上的强项,正努力推动智能高速公路在自动驾驶领域的应用,尽管目前尚不清楚这一创新技术究竟能在自动驾驶的发展中发挥多大作用。
此外,中美自动驾驶市场的分裂发展也意味着商业化的成果可能会被少数几家主要运营商所瓜分。随着对下一代机器人技术主导权的竞争日益激烈,类似的分歧和竞争也可能持续存在。但无论如何,中国智能高速公路的建设无疑为无人驾驶技术的未来发展开辟了新的道路,让我们共同期待这一技术带来的美好未来。
来源|心智观察所
还没有评论,来说两句吧...