对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
智能汽车|极端驾驶场景|虚拟驾驶训练|世界模型|自动驾驶|人工智能
一名新手司机,从驾校毕业到熟练上路,需要经历数千公里的真实磨砺,在一次次紧张的并线、惊险的急刹中积累经验。过去,自动驾驶AI的学习路径与此类似——通过观摩数百万甚至上亿公里的人类驾驶录像,模仿“老司机”的操作。但这种模仿存在一个难以逾越的天花板:AI学得再好,也只能达到人类司机的平均水平,且永远无法穷尽真实世界中那些千奇百怪的“长尾场景”。
然而,一个颠覆性的转折点已经到来。如果一个AI司机能在虚拟世界里,一天之内就完成人类500年的驾驶训练,经历一切可以想象的极端天气和突发事故,而无需在现实中留下一丝划痕,结果会怎样?这并非科幻,而是正在重塑智能汽车产业格局的现实。在近期的计算机视觉顶会ICCV 2025上,特斯拉、理想汽车等头部玩家不约而同地揭示了行业的下一个风口:告别单纯依赖真实数据的“数据闭环”,全面迈向一个由“世界模型”与“强化学习”驱动的“训练闭环”时代。
在自动驾驶的上半场,“数据闭环”是行业金科玉律。其逻辑简单直接:让庞大的车队在真实道路上行驶,采集海量数据;将数据传回云端,用于训练AI模型;再将优化后的模型部署到车上。这个循环往复的过程,确实让辅助驾驶能力在过去几年里飞速提升。
然而,随着行业向更高阶的L4级自动驾驶迈进,这条路的局限性日益凸显。理想汽车的VLA模型负责人詹锟一针见血地指出:“AI基于模仿学习,只能学到数据的平均水平,难以超越人类司机的能力。”模仿,意味着AI只能复制它所见过的情景。面对一个从未在数据中出现过的、极其罕见的极端场景——比如高速公路上突然滚落的轮胎,或是前方货车散落的异形货物——模仿学习模型可能会因缺乏先验知识而决策失效,构成致命风险。
更重要的是,真实世界的数据采集成本高昂且效率低下。为了捕捉一次罕见的雨夜行人横穿马路场景,可能需要车队空跑数万公里。这种“守株待兔”式的数据收集方式,永远无法覆盖物理世界近乎无穷的可能性组合。数据,这个曾经的助推器,正逐渐变成一个沉重的瓶颈。技术范式,亟待一场革命。
这场革命的核心,正是“世界模型”。它不是传统意义上的游戏引擎或简单仿真器,而是一个基于海量真实数据学习并构建的、与物理世界高度一致的“数字孪生宇宙”。在这个虚拟世界里,不仅有逼真的道路、建筑和光影,更重要的是,它理解并遵循物理规律,能够推演万物交互的因果链。
构建这样一个“汽车的盗梦空间”,技术上极具挑战。理想汽车为此开创性地采用了“重建”与“生成”相结合的路线。一方面,通过名为“3D高斯泼溅”(3D Gaussian Splatting)等先进技术,将采集到的真实街景数据进行高保真三维重建,确保虚拟环境的“真实感”和“稳定性”。其参与的Street Gaussians、Hierarchy UGP等研究成果,已在ECCV、ICCV等顶会上达到世界顶尖水平。
另一方面,也是更具颠覆性的一步,是利用生成式AI的能力,对重建的场景进行编辑、迁移甚至完全创造。这意味着工程师可以在云端“扮演上帝”:将一个晴空万里的普通路口,一键切换为暴雨倾盆的深夜;让一辆规规矩矩行驶的汽车,突然做出连续变道、紧急刹车的“鬼探头”行为。通过这种方式,可以低成本、大规模地生成无穷无尽的、人类司机一生都难得一见的极端“长尾场景”数据,让数据分布从“常见”变得“均衡”。
特斯拉的“世界模拟器”更是将这一理念推向极致。其AI系统能在一天内学习相当于人类500年驾驶时长的经验,在虚拟世界中反复演练历史上的真实危险事故,并探索上百种不同的应对策略,从而找到最优解。世界模型,正从根本上破解自动驾驶的数据难题。
有了近乎无限的虚拟训练场,AI的学习方式也发生了质变——从“模仿”升级为“探索”。这便是“强化学习”(Reinforcement Learning)的用武之地。
在世界模型中,自动驾驶AI不再是一个被动学习者,而是一个主动探索的智能体(Agent)。它的目标不再是“模仿人类怎么开”,而是“如何更好地完成驾驶任务”。系统会设定一套奖励与惩罚机制:安全、平稳、高效地到达目的地会获得“奖励”;而发生碰撞、违反交规、造成乘客不适则会受到“惩罚”。
AI就在这个虚拟世界里,日以继夜地进行着海量的“试错”。它会尝试各种“离经叛道”的驾驶策略,在一次次虚拟“事故”中吸取教训,在一次次成功“通关”后固化经验。通过这种方式,AI能够自主发现并学会那些远超人类直觉的最优驾驶策略。例如,在面对前车失控的瞬间,特斯拉的FSD系统能够做出超越人类反应速度的预判——它判断出失控车辆会撞上护栏再反弹回自己车道,并提前采取制动。这种“神级预判”,正是强化学习在世界模型中反复推演、自我进化的结果。
当然,这一过程也面临着新的挑战,其中最棘手的便是如何模拟其他交通参与者(仿真智能体)的行为。理想汽车坦言,完整建模他车与自车、他车与他车之间的复杂博弈,其难度甚至超过实现单车L4。为此,他们正通过设定复杂的目标和奖励函数,约束虚拟世界中其他智能体的行为,使其表现出从“新手”到“路怒症”等各种驾驶风格,从而创造出一个更加真实、动态的交互环境。
从“数据闭环”到“训练闭环”的范式迁移,带来的绝不仅仅是技术路线的升级,更是一场深刻的产业格局重塑。构建和运维世界模型需要极其庞大的算力集群、顶尖的AI算法人才和持续的巨额研发投入。这正在快速拉开头部玩家与追随者之间的差距,形成一道难以逾越的“技术护城河”。
理想汽车的快速崛起,正是其成功构建多个“闭环飞轮”的体现。率先盈利跑通的“商业闭环”,为其连续数年超百亿的研发投入提供了充足弹药;源于量产瓶颈、反哺量产落地的“研产闭环”,确保了前沿研究能高效转化为用户体验的提升;而如今构建的“训练闭环”,则为其通往更高阶自动驾驶的未来锁定了胜局。
更深远的意义在于,这场技术变革正在重新定义“汽车”。当一辆车拥有了在虚拟世界中理解并预测物理规律的能力,它便不再仅仅是交通工具。理想汽车已将自身的新目标定义为“成长为空间机器人企业”。特斯拉更是将训练汽车的“世界模拟器”直接用于训练其“擎天柱”人形机器人。汽车,正成为人类历史上第一个大规模进入日常生活的、具备与物理世界深度交互能力的通用机器人。
当汽车开始在虚拟的“盗梦空间”里思考、学习和进化,一个由物理AI驱动的新时代已然开启。未来的道路,将由这些在数字孪生世界里千锤百炼的“AI老司机”所定义。它们不仅将比人类更安全、更高效,更将彻底改变我们与物理世界的交互方式,引领我们驶向一个更加智能、更加广阔的未来。