对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
10.3亿美元融资|真实世界理解|世界模型|AMI Labs|Yann LeCun|大语言模型|人工智能
当一位患者向AI描述胸痛时,大语言模型可能会流利地列出一堆可能的病因——但它永远不会像真正的医生那样,通过患者的呼吸节奏、脸色变化甚至下意识的手势,判断出这是需要立刻抢救的急性心梗。这种致命的"无知",正是图灵奖得主Yann LeCun带着10.3亿美元融资离开Meta的原因。他新创立的AMI Labs,要做的不是更会说话的AI,而是能像人类一样"看懂"真实世界的AI。为什么资本愿意押注一个可能要等上数年才能盈利的项目?答案藏在一个叫"世界模型"的概念里。
你可以把大语言模型想象成一个超级厉害的猜词玩家——它读了万亿级别的文本,能精准预测下一个最可能出现的词,但它根本不知道这些词背后的真实世界是什么样的。它能说清"阿司匹林"的药理,却不知道药片拿在手里的重量,更不会理解"空腹吃"对肠胃的真实刺激。这就是它会"胡言乱语"的根源:它只懂语言的统计规律,不懂世界的因果逻辑。

而世界模型(World Models),就是让AI在脑子里建一个"动态沙盘"——它不是靠文本猜词,而是通过视频、传感器数据等多模态信息,学习真实世界的物理规则、因果关系,甚至能模拟出"如果我做了A,接下来会发生B还是C"。比如给它看一段煎鸡蛋的视频,它能理解油温、蛋液状态和翻炒动作之间的联系,而不是只会生成一段关于煎蛋的文字描述。

AMI Labs的核心武器,是LeCun在2022年提出的JEPA架构(联合嵌入预测架构)。简单说,它不要求AI还原每个像素的细节,而是让AI学习事物的"本质特征"——就像人类看到半张脸也能认出熟人,而不是必须看清每根睫毛。JEPA会让AI从部分信息里预测整体的抽象表示,比如从被遮挡的图像里推测完整物体,从片段视频里预测后续动作,这种学习方式更接近人类的认知逻辑,也能避开大语言模型"细节幻觉"的陷阱。

AMI Labs的10.3亿美元融资名单,堪称科技圈的"全明星阵容":贝佐斯探险基金、英伟达、三星,还有蒂姆·伯纳斯-李、马克·库班这样的大佬。但和那些3个月出产品、6个月赚营收的AI公司不同,AMI Labs的CEO Alexandre LeBrun明确说,这是个"需要先做基础研究"的项目,商业化可能要等上好几年。
资本愿意等,是因为他们看到了大语言模型的天花板——在医疗、自动驾驶、机器人这些高风险领域,"差不多对"远远不够。比如在医疗场景,大语言模型可能会编造不存在的临床数据,而基于世界模型的AI,能通过患者的实时体征数据、影像资料,模拟病情的发展趋势,甚至能预测不同治疗方案的效果,就像在脑子里给患者做了一次"虚拟治疗"。AMI Labs的第一个合作伙伴就是医疗AI公司Nabla,目标就是解决大语言模型在医疗领域的"致命幻觉"问题。
但这条路并不好走。训练世界模型需要的不是文本,而是海量的多模态真实数据——比如连续的手术视频、机器人的运动传感器数据、自动驾驶的路测数据,这些数据不仅获取成本高,处理起来也更复杂。而且要让AI真正理解世界,还要解决跨模态融合、长时序预测、因果推理等一系列难题。比如现在的JEPA模型能处理静态图像和短视频,但要让它模拟一个患者几天甚至几周的病情变化,还需要突破更长时间尺度的建模能力。
我认为,世界模型不是要取代大语言模型,而是给它补上"认知世界"的短板。未来真正的通用AI,应该是一个"会说话的世界模型"——既能用自然语言和人类交流,又能通过内部的"动态沙盘"理解真实世界的规则。比如你让它"帮我设计一个书架",它不仅能生成文字方案,还能在脑子里模拟出书架的承重、安装难度,甚至能预测不同材质在不同环境下的老化速度。
现在已经有不少玩家在布局这条赛道:李飞飞创立的World Labs推出了能生成物理合理3D世界的Marble平台,Google DeepMind也在研发能模拟环境动态的Genie系列模型。但AMI Labs的优势在于,它从一开始就瞄准了真实世界的应用,而不是先做技术再找场景。LeCun和LeBrun都在医疗领域看到了大语言模型的局限,这也让AMI Labs的研究方向更聚焦——先解决高风险场景的痛点,再逐步拓展到其他领域。
当然,这条赛道也面临着很多挑战:数据隐私问题、模型的可解释性、监管合规……毕竟当AI能"理解"真实世界并做出决策时,一旦出错,后果可能比大语言模型的"幻觉"严重得多。比如自动驾驶的AI如果误判了路况,可能会导致交通事故;医疗AI如果误判了病情,可能会危及生命。这也是为什么AMI Labs强调要和行业伙伴深度合作,把模型放到真实场景里反复验证,而不是关在实验室里做研究。
当我们为大语言模型的"妙语连珠"惊叹时,LeCun们看到的是它"不懂世界"的本质缺陷。就像一个背熟了百科全书的孩子,能回答所有书本上的问题,却不知道火会烫手、水会结冰。
世界模型的意义,就是让AI从"背书本"的孩子,变成能"在生活中学习"的成年人。它不需要一开始就无所不能,但它需要能感知、能理解、能预测——就像我们每个人认识世界的过程一样。
真正的智能,从理解世界开始。