
5 个月前
一片陌生的猩红色大地在眼前展开,远处,奇形怪状的植物向着两颗太阳伸展。没有任务指引,没有教学流程,只有一个声音传来:“找到那艘坠毁的飞船,然后活下去。”
这不是某个游戏主播的开场白,而是一个AI智能体“睁开双眼”后面对的世界。它不知道这颗星球的物理法则,也不认识这里的生物,但它开始移动、观察、尝试、失败,再尝试。这个AI,就是谷歌DeepMind最新的智能体SIMA 2。它正在学习的,不仅仅是如何玩《无人深空》、《Valheim》或《模拟山羊3》这些开放世界游戏,更是在学习如何“理解”一个世界。
DeepMind的科学家们毫不掩饰他们的雄心。他们宣称,SIMA 2在虚拟游戏中的探索,是通往“通用人工智能(AGI)的根本一步”。这听起来有些夸张——玩游戏,这个人类最古老的娱乐方式之一,怎么就成了通往智能圣杯的关键路径?
答案藏在一个看似简单的概念背后:世界模型(World Models)。
长久以来,AI在特定任务上超越人类,靠的是在海量数据中学习模式。AlphaGo能击败李世石,因为它“背”下了人类历史上几乎所有的棋谱,并与自己对弈了数百万盘。但这些AI更像是记忆超群、计算力惊人的“专才”,它们的世界被棋盘或规则严格限定。一旦走出这个范围,它们便寸步难行。
而一个蹒跚学步的婴儿,虽然不懂微积分,却拥有一种更底层的智能:他知道,松开手的玩具会掉下去;推倒的积木会散落一地。这种对世界运行规律的本能理解,就是一种内在的“世界模型”。
SIMA 2的突破,正是在于此。它不再仅仅是对屏幕上的像素做出反应,而是试图在“脑海”中构建一个关于虚拟世界的内在模型。它要理解,拿起斧头可以砍树,木材可以用来建造,夜晚会有怪物出没。这种基于因果关系的推理能力,让它即使面对一个从未见过的游戏,也能根据高级指令(比如“帮我收集一些铁矿石”)自主规划并执行一系列复杂动作。
DeepMind研究科学家Jane Wang将游戏世界称为一个“绝佳的训练场”。在这里,AI可以以极低的成本、在绝对安全的环境中,进行无数次的试错,直到它真正建立起对世界的“直觉”。
如果说SIMA 2是那个不断学习的学生,那么DeepMind的另一个工具Genie 3,就是那位能凭空创造出无穷教室的“神笔马良”。
Genie 3是一个革命性的世界生成模型。你只需输入一句文字,比如“一座日本古代的街道,樱花正在飘落”,它就能实时生成一个可供探索的、每秒24帧的互动虚拟环境。更神奇的是,它支持“可提示的世界事件”,当SIMA 2在其中探索时,研究人员可以输入“天空突然下起暴风雨”,整个世界的环境、光影、物理效果都会随之实时改变。
这解决了具身智能训练中最核心的瓶颈:数据。现实世界的机器人训练数据昂贵、稀缺且充满风险。但在Genie 3创造的无限世界里,SIMA 2可以经历它在现实中可能永远无法遇到的极端情况,学习如何应对突发事件。这种“模拟训练,现实应用”(Sim2Real)的范式,正成为通往通用机器人的高速公路。
谷歌DeepMind并非唯一看到这条路径的玩家。一场围绕世界模型和空间智能的竞赛早已拉开帷幕。
斯坦福大学教授、AI领域的领军人物李飞飞,创办了公司World Labs,其推出的产品Marble,同样致力于通过多模态输入构建可交互的3D世界。李飞飞一针见血地指出,人类智能的核心并非语言,而是我们与生俱来对三维空间的理解和互动能力——即“空间智能”。在她看来,当前的大语言模型被困在由文本构成的“扁平世界”里,而世界模型正是让AI挣脱束缚、理解真实物理世界的关键。
另一边,硬件巨头英伟达(NVIDIA)正利用其在图形和物理模拟领域的深厚积累,打造Isaac Lab等仿真平台,专门用于训练机器人。而埃隆·马斯克旗下的xAI,也在积极从英伟达招募人才,目标直指用世界模型打造下一代AI游戏,并最终服务于特斯拉的自动驾驶和机器人计划。
所有巨头的行动都指向同一个共识:AI的下一站,必然是走出屏幕,走向物理世界。而游戏,这个看似玩乐的虚拟沙盒,正是通往现实的最佳跳板。
这一切努力的终极目标是什么?是让一个在《Valheim》里学会了搭建庇护所的AI,未来能指导建筑机器人在灾区快速搭建临时住所;是让一个在《无人深空》里学会了驾驶飞船、管理资源的AI,未来能操控深空探测器,自主完成探索任务。
走向物理世界,是AGI形成的必由之路。因为真正的智能,不仅在于处理信息,更在于与环境互动,解决现实问题。AI在虚拟游戏中的每一次“死亡”和“重生”,每一次失败的尝试和成功的创造,都在为它积累宝贵的经验。这些经验,远比阅读数万亿字的文本更接近智能的本质——适应与行动。
当然,前路依然漫长。目前的SIMA 2在处理超长期、复杂任务时仍显吃力,它的“记忆”也还很短暂。但它所代表的方向,却无比清晰。
我们正处在一个奇特的历史节点。曾经,我们创造游戏是为了逃离现实、娱乐自身。而今,我们正引导我们最聪明的造物进入这些虚拟世界,不是为了让它们娱乐,而是为了让它们学习。它们在像素构成的宇宙中探索,最终目标,却是为了更好地服务于我们这个由原子构成的真实世界。
或许,当下一个AI智能体在虚拟的星辰大海中学会远航时,它真正看到的,是人类与智能机器人在现实世界并肩前行的未来。
点击充电,成为大圆镜下一个视频选题!