对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
世界模型|经验数据|人类分寸感|机器人学习|AI智能体|人工智能
现在的AI能写代码改方案,能把一篇论文润色得像出自名家之手,甚至能帮你规划一场环球旅行。但你让它进厨房炒一盘蛋炒饭,它只会原地死机——不是因为它不知道蛋炒饭的步骤,而是它永远学不会“饭粒在油里刚要冒烟时倒蛋液”的分寸,摸不透“锅铲碰到锅底那一下该用多大劲”的尺度。当LeCun和李飞飞各自拿着10亿美元押注世界模型,整个AI圈都在喊着“走进物理世界”时,所有人都忽略了一个最基础的问题:机器人要学的那些“人类分寸感”,到底要怎么变成AI能读懂的数据?
过去十年,AI是靠互联网喂大的:文本、图片、短视频,这些“被动观看”的数据让它学会了理解语言、识别猫和狗。但当它要走进厨房、拿起锅铲,这些数据就像一本没有插图的菜谱——字都认识,就是不知道怎么动手。
机器人学习的历史,其实就是数据采集方式的三次进化。最早是仿真数据,在电脑里模拟一万次炒蛋炒饭,成本低得离谱,但到了真实厨房,机器人会被灶台的油烟、滑溜溜的鸡蛋壳彻底搞懵——这就是“仿真到现实的鸿沟”。然后是遥操作数据,人类戴着动捕手套操控机器人炒菜,数据够真实,但成本高到离谱,一个实验室一年也采不了100小时,更别说覆盖全世界千万种不一样的厨房。

直到Ropedia的HOMIE平台出现,事情才开始有转机。你不需要动捕服,不需要专业实验室,只要戴上一副类似智能眼镜的设备,正常走进厨房炒一次蛋炒饭——它就会同步记录下你眼睛看到的360°画面、手的每一次翻转、锅铲的力度变化,甚至你倒油时犹豫的0.2秒。这些不是“视频片段”,而是一套完整的“人类经验数据”:从你站在厨房门口的那一刻起,空间、动作、交互、后果,四个维度的数据像钟表齿轮一样精准咬合。

Ropedia把这套数据标准叫“4D物理世界”——不是简单的3D加时间,而是空间(你在厨房的位置、冰箱和灶台的距离)、时间(什么时候倒油、什么时候下米)、交互(手碰到锅铲、蛋碰到米饭)、后果(米饭从生到熟、蛋液从液态到凝固)的闭环。

你可以把它想象成一本超级详细的菜谱:不仅有步骤,还有每一步的“体感注解”。比如炒蛋炒饭时,“米饭要炒散”这句话,在4D数据里会被拆解成:锅铲与米饭的接触角度是30度,手腕每秒转动2次,米饭颗粒在锅中的运动轨迹是螺旋状,直到90%的颗粒从粘连变成松散。这些数据不是靠人工标注的——Ropedia的空间基础模型会像一个“AI助教”,自动把人类的动作翻译成机器能读懂的语言,而且数据越多,这个“助教”就越聪明,标注的精度也越高。
英伟达的EgoScale研究早就证明了这种数据的力量:用20000小时的人类第一视角动作数据训练机器人,它完成复杂操作的成功率从30%跳到了71%,而且没有任何性能饱和的迹象。换句话说,人类在真实世界里的每一次抬手、每一次转身,都是在给机器人“上课”——而Ropedia做的,就是把这些“课程”整理成一套标准化的教材。
当LeCun说“六个月后每家公司都会自称世界模型”时,他其实没说后半句:没有高质量的经验数据,所有世界模型都是空中楼阁。
Ropedia的聪明之处,在于它不跟LeCun、李飞飞抢“世界模型”的风头,也不跟特斯拉、Figure抢机器人硬件的市场——它只做一件事:给这些“未来的智能”提供高辛烷值的燃料。就像大语言模型时代的Scale AI,靠标注文本和图像做到了百亿美元估值,但Ropedia面对的是一个更底层、更庞大的市场:大语言模型的数据是二维的、静态的,而Physical AI的数据是4D的、动态的,结构化难度呈指数级上升。
现在,北美科技大厂、明星机器人公司都在找Ropedia要数据——它们缺的不是视频,而是能直接喂进模型的“经验模块”。比如一家做家庭机器人的公司,拿到Ropedia的厨房数据后,不需要再花几年时间让机器人在实验室里试错,只要把这些数据“灌”进模型,机器人就能快速学会怎么开你家的冰箱、怎么用你家的炒锅。
我认为,这才是AI从“数字世界”走向“物理世界”的关键一步:当所有人都在盯着模型和硬件时,真正的壁垒其实藏在数据里——藏在那些人类习以为常、却从来没被记录下来的“分寸感”里。
未来某一天,当机器人真的走进你家厨房,熟练地从冰箱里拿出鸡蛋和米饭,精准地控制着火候炒出一盘蛋炒饭时,你可能会觉得这是AI的胜利。但你不知道的是,它背后站着成千上万像你一样的普通人,戴着HOMIE设备在厨房、在办公室、在工厂里,把自己的日常动作变成了数据。
数据不是冰冷的数字,是人类经验的复刻。 从互联网的“被动观看”到物理世界的“主动经验”,AI正在完成一次最朴素的进化:就像人类小时候靠模仿父母学会吃饭穿衣,未来的AI,也要靠模仿人类的每一次抬手、每一次转身,学会在这个真实的世界里活下去。而这一切的起点,就是那些被我们忽略的、最日常的“分寸感”。