当家里一尘不染，机器人还向谁学习？

一尘不染时，它不再“向灰尘学”，而是借力更大的老师：跨家庭的异质数据和云端场景库（常用联邦/端侧训练以保护隐私），仿真与生成式“合成脏乱度”（程序化布置油渍、反光、玻璃等难例），以及自身执行中积累的失败轨迹。通过价值函数给数据打分、离线强化学习反复回放边界样本，它能在不弄脏你家的前提下持续变强。干净环境反而适合打磨“通用底盘”：力控与摩擦估计、接触瞬态建模、滑移检测、工具位姿与手眼标定、视觉-触觉对齐等可迁移技能。世界模型会在“脑内”做多步预演，生成对抗式难例作为课程，不断自我挑战；端侧的小步自适应微调，则把你的家居布局与个人偏好融入策略，而不必依赖新的污渍。所以它既向人学（示教与群体数据），也向物理学（接触与动力学先验），更向“未来的自己”学（世界模型的想象与自我博弈）。一尘不染不是终点，而是更精准评估与快速对齐的最佳起点。

机器人会不会“看穿”我不想干的家务？

不会。它做的不是“读心术”，而是概率推断。通过偏好学习、逆向强化学习和贝叶斯推理，把你的语音指令、反复跳过的任务、抱怨语气、日程与环境信号拼在一起，估计“你不想干哪项家务”的可能性，然后调整分配与时机。这是统计相关，不是洞悉动机。可预见的体验是：它会察觉你总把洗碗拖到深夜或口头吐槽，于是把洗碗上调为“自接单”，但在执行前弹出一次确认；涉及风险或强偏好（如收拾衣柜、处理宠物用品）仍需显式授权。成熟产品会配解释与可撤销记忆、本地化学习开关，降低误判与隐私压力。两三年内它会更会“察言观色”，但想在无提示下稳定拿捏你真实意愿，至少还要更长一段多模态理解与可靠性爬坡。最有效的办法，依然是你给出可被学习的信号：设定黑白名单与偏好阈值，允许它在不确定时追问，并定期审计它的“家务画像”。临时不想干，它能听懂；想长期不干，记得给它一个明确的“正标签”。

机器人打碎花瓶，是故障还是“创作”？

是故障，不是“创作”。当下的家庭机器人不具备主观意图与审美目的，其行为由目标函数、训练数据与控制器决定。打碎花瓶多源于感知误判（把脆弱物体当可抓物）、抓取/力控不当、环境超分布或探索策略越界；在系统侧会体现为负回报、力/速度超阈、避碰或安全约束违例，被事件记录为“incident”。判定与处置也很工程：调取黑盒日志与相机回放，核对触觉/力矩曲线与约束计数；用价值函数与失败边界评估器标注为失败样本，随后修正策略——加强脆弱物体识别、设定自适应阻抗与安全动作过滤（如控制屏障函数）、引入第一人称与评估数据，提高对易碎场景的泛化，降低复发率。责任上仍指向人类系统（设计、部署、维护）。除非你明确赋予“以碎片为材料创作”的目标，并能在意图生成与审核链路中留痕，否则“创作”无从谈起。在可预见的几年里，这类事件更像一次可复盘、可修复的工程事故。

新知 - 大圆镜｜放弃主流路线，科学家要造会做家务的机器人

对抗知识焦虑，从看懂这条开始

App 下载

不用语言当中间件，直接学「视频-动作」

过去的机器人学做家务，得先把视觉信息转成语言描述，再把语言指令转成动作——就像你给一个完全不懂中文的人做饭，要先把菜谱翻译成英文，再让他按步骤做，中间每一层转换都会丢信息，更别说应对家里突然移位的杯子、换了包装的洗衣液。

许华哲的团队直接跳过了语言这层中间件，他们给AI喂的是「视频+动作」的配对数据：比如人叠衣服的第一视角视频，同步对应着手臂、手指的运动轨迹。你可以把这个过程想象成学跳舞——不是看文字教程记动作，是对着镜面反复模仿老师的连贯动作，连肌肉的发力节奏都一起学。

这种「视频-动作世界模型」的核心是一个叫UAG的并联训练架构：先单独把所有动作数据练熟，再和视觉模型一起联合训练。一个小时的视频数据是海量的像素，但一个小时的动作只是关节的一串浮动数值——这种方式把训练效率拉快了5倍以上，还能最大程度保留AI的泛化能力，让它能看懂没见过的衣服褶皱，调整没练过的叠法。

让机器人从失败里学，超越人类示范

光靠模仿人类还不够——人类叠衣服的动作未必是机器人最顺手的，而且家里总会出现没见过的情况。许华哲的团队把强化学习贯穿了训练的全过程，这相当于给机器人装了个「自我复盘」的大脑。

传统的机器人强化学习只在最后调参数用，他们却把离线强化学习放进了预训练阶段：AI会一边看人类的示范数据，一边自己在虚拟环境里试错，比如叠错了衣服、碰倒了杯子，系统会用「价值函数」给这些失败样本打分，告诉AI「这样做不对，为什么不对」。就像你学骑车，摔过几次才知道怎么保持平衡，AI也会从失败里记住哪些动作会导致任务崩盘。

更关键的是，这种方式能让机器人突破人类示范的上限。比如人类叠一件毛衣可能需要10秒，AI通过反复试错，能找到更高效的动作路径，8秒就能完成；人类可能没练过叠奇形怪状的围巾，AI却能从叠衣服的经验里推导出围巾的叠法。用许华哲的话说，「我们要的不是一个模仿者，是一个能自己解决问题的助手」。

从实验室到客厅，还要跨三道坎

但要让机器人真的走进千万家庭，还有三道坎要跨。

第一道是数据的「真实感」。实验室里的衣服都是平整的、杯子都是放在固定位置的，但你家的沙发上可能堆着揉成球的T恤，餐桌上的杯子可能歪歪扭扭。许华哲的团队用了三层数据采集方案：外骨骼提着机械臂采高精度数据，UMI硬手套让普通人就能快速采集大量动作，还有第一视角摄像头记录人在家干活的自然状态——连你偶尔偷懒的潦草叠法都会被记录进去，这样AI才不会在真实家庭里「水土不服」。

第二道是成本的「亲民化」。现在的人形机器人动辄几十万，普通家庭根本买不起。许华哲的团队算过账：家庭机器人不该是奢侈品，而是像当年的智能手机，初期可能五位数起步，但随着供应链成熟、量产规模扩大，价格会慢慢降到大众能接受的区间。

第三道是安全的「底线」。机器人在你家走来走去，不能碰倒花瓶，不能撞到老人孩子。目前行业里已经有了ISO 13482这样的安全标准，要求机器人必须有紧急停止、防碰撞的机制，但更细节的问题——比如机器人突然没电了怎么避免摔倒，还需要技术和设计的双重打磨。

许华哲说，他从小读《乔布斯传》时就想造一款改变生活的产品，现在这个机会终于来了。过去几十年，机器人一直在工厂里做重复劳动，就像被关在笼子里的鸟；而家庭场景是一片真正的森林，这里没有预设的轨道，只有无穷无尽的意外和需求。

真正的通用人工智能，从来不是在实验室里算出完美的公式，而是能在乱糟糟的生活里，帮你叠好一件揉皱的衬衫，冲一杯温度刚好的咖啡。

泛化能力，是机器人读懂生活的钥匙。

不用语言当中间件，直接学「视频-动作」

让机器人从失败里学，超越人类示范

从实验室到客厅，还要跨三道坎

评论