除了复刻世界，AI能懂物理吗？

能，但要分清“看起来像”与“按规律算”。多数世界模型擅长复刻几何与光照，是“会演”的AI；“懂物理”要能受约束地预测未来。近来的证据不少：Genesis把多物理场做成可微模拟，单卡可达数千万FPS，给具身智能提供可用力学反馈；PhysCtrl能从一张照片加上力与材质参数，生成遵守MPM等约束的运动；PhyT2V用LLM迭代纠错，让文本生成视频更守重力、碰撞等规则。这些都在把“直觉物理”变成可计算模型。短板同样明显：生成模型仍常在接触、摩擦和能量守恒上“穿帮”，尺度与时间一换就失真，真实带标物理数据稀缺。业内正用IntPhys/PHYRE/Physion等基准、能量动量误差、接触渗透率与长时稳定性来量化“懂没懂”，最终还得看机器人端的sim2real成功率。务实路径是混合：用Marble这类几何世界自动识别可动体、材质与关节，做逆向参数估计，再接上可微物理求解器执行；同时把守恒、约束显式写进扩散/视频模型。若这两端打通，AI不止能复刻，还能算得准、控得住。

虚拟世界能否预演真实城市灾难？

能，但前提是把“漂亮的虚拟城市场景”变成“受物理和数据约束的数字孪生”。当下多地已在做：Virtual Singapore用真实GIS与建筑BIM叠加洪涝与疏散推演；荷兰把城市内涝模型接入排水泵站与潮位传感器做小时级预报；日本在地震情景下用基于主体的交通与人群模型演练避难；气象侧则有公里级分辨率的台风与暴雨数值—AI混合预测，可把极端天气投射到路网、医院与电力资产上做联动演练。难点也很清晰：生成式世界模型能迅速还原几何与材质，但可用的灾害预演还需要四件套——经核验的城市资产台账与地下管网、经过标定的物理求解器（洪水/风场/烟热CFD/震害/危化扩散）、人群与车辆的行为模型，以及物联网数据的实时同化与不确定性量化。否则就会在级联失效（停电—通信—交通）与人群反应上失真。实操上，选一个单灾种切入（如城市内涝或高层火灾疏散），用OpenUSD/Omniverse或同类平台把BIM+GIS+传感器接上，做多情景集合推演，并用演练KPI（黄金一小时救护到达率、关键泵站溢流概率）闭环校准，虚拟预演才会真正“管用”。

AI能重建你回不去的故乡吗？

能，但更像“重建体验”而非“复原现实”。用世界模型叠加摄影测量与历史影像，可把一条老街以厘米级精度在网页或VR中重生；巴黎圣母院与帕尔米拉的数字复原、国内城市的倾斜摄影都已跑通链路。缺图处，Marble/Luma 等模型能做阿莫代尔补全，把看不见的拐角与室内结构做出合理推断。边界也清晰：缺失会被“合理想象”，店招、墙皮与年代感可能错配。若追求可信重建，应把生成当“假说”，用航测/街景/地籍与口述史校对，在GIS坐标内分层标注年代与置信度，实测层与生成层可切换；音景可用生成音频补齐，但需与实录区分。同时处理好肖像权、商标与隐私。所以，AI能让你再次走进“可居住的记忆”，也能为修复与教育留下数字底座；但它重建的，往往是你与社区愿意相信的版本。想找回故乡，技术做减法，考证做加法，情感的缺口，仍需人来填。

新知 - 大圆镜｜AI学会造大3D世界，不止是游戏党福音

大圆镜

内容由AI生成，思考得你完成

App Store 下载 Android 下载

当你上传一张富士山的日落照，输入一行“霓虹复古房间俯瞰山景”的文字，就能生成一个可漫步的3D空间——甚至能在蘑菇小屋的森林里添一只啃胡萝卜的兔子，这不是科幻片里的道具，是李飞飞团队刚更新的生成式世界模型实现的效果。更颠覆的是，它能把真实工作室的360度全景图，转成一个设备布局更复杂、窗外景色完全不同的“平行空间”，让“同一空间的千万种可能”不再是想象。为什么短短半年，AI就能从画2D图跃进到造完整3D世界？答案藏在对“空间智能”的理解里。

生成式世界模型，本质是让AI像人类一样“看懂”并构建三维空间——不再是拼接零散的3D资产，而是从物理规律到光影细节，生成一个逻辑自洽的完整世界。这次更新的两个版本，像是一对分工明确的搭档：一个专注打磨细节，把光照、对比度的瑕疵降到最低，生成的魔法森林里，蘑菇房的金窗反光、树叶间的光斑都能保持一致；另一个专攻规模，能把单个场景无缝扩展成连成片的古堡群，甚至看清建筑拐角的苔藓纹理。

这背后的逻辑，像把传统3D建模的流水线彻底反转。过去要造一个游戏场景，得先画草图、建模型、贴纹理，几个团队耗几个月；现在只要给AI一张参考图或几句描述，它能一次性生成带物理碰撞的完整空间——就像你给厨师看一张美食照片，他直接端出一整桌配套的宴席，连餐具和灯光都给你配好。更关键的是，它解决了大场景生成的核心难题：传统方法造越大的场景，细节越容易混乱，而新模型用分块渲染和空间记忆技术，让扩展后的场景和原场景保持风格、逻辑的高度统一。

但这并不意味着AI能完全替代人类创作者。目前它还存在不少局限：扩展功能需要付费，生成超大规模场景时偶尔会出现纹理错位，而且对高度专业的工程结构，比如精确的建筑力学模型，还无法做到精准生成。它更像一个超级助理，把最耗时、最重复的建模工作接手，让创作者把精力放在创意和细节打磨上——比如游戏开发者不用再花几个月建森林地形，而是直接用AI生成的基础场景，专注设计隐藏在树后的宝箱和怪物AI。

更值得关注的是，这不是一次单纯的技术升级，而是AI从“理解语言”到“理解物理世界”的关键一步。当AI能生成符合物理规律的3D空间，它的应用边界会从游戏、影视延伸到更务实的领域：建筑师可以快速生成不同设计方案的虚拟空间，让客户直接“走进去”体验；机器人可以在AI生成的无数虚拟场景里训练，不用再依赖昂贵的真实环境；甚至城市规划师能通过AI生成的虚拟城市，模拟不同交通方案的通行效率。

从画一张图到造一个世界，AI正在把“空间”变成一种可编辑的语言。未来我们谈论的可能不再是“AI生成了一张图”，而是“AI帮我构建了一个能住进去的想象”。而这，只是AI理解物理世界的开始。

评论