
12 天前
当你上传一张富士山的日落照,输入一行“霓虹复古房间俯瞰山景”的文字,就能生成一个可漫步的3D空间——甚至能在蘑菇小屋的森林里添一只啃胡萝卜的兔子,这不是科幻片里的道具,是李飞飞团队刚更新的生成式世界模型实现的效果。更颠覆的是,它能把真实工作室的360度全景图,转成一个设备布局更复杂、窗外景色完全不同的“平行空间”,让“同一空间的千万种可能”不再是想象。为什么短短半年,AI就能从画2D图跃进到造完整3D世界?答案藏在对“空间智能”的理解里。
生成式世界模型,本质是让AI像人类一样“看懂”并构建三维空间——不再是拼接零散的3D资产,而是从物理规律到光影细节,生成一个逻辑自洽的完整世界。这次更新的两个版本,像是一对分工明确的搭档:一个专注打磨细节,把光照、对比度的瑕疵降到最低,生成的魔法森林里,蘑菇房的金窗反光、树叶间的光斑都能保持一致;另一个专攻规模,能把单个场景无缝扩展成连成片的古堡群,甚至看清建筑拐角的苔藓纹理。

这背后的逻辑,像把传统3D建模的流水线彻底反转。过去要造一个游戏场景,得先画草图、建模型、贴纹理,几个团队耗几个月;现在只要给AI一张参考图或几句描述,它能一次性生成带物理碰撞的完整空间——就像你给厨师看一张美食照片,他直接端出一整桌配套的宴席,连餐具和灯光都给你配好。更关键的是,它解决了大场景生成的核心难题:传统方法造越大的场景,细节越容易混乱,而新模型用分块渲染和空间记忆技术,让扩展后的场景和原场景保持风格、逻辑的高度统一。

但这并不意味着AI能完全替代人类创作者。目前它还存在不少局限:扩展功能需要付费,生成超大规模场景时偶尔会出现纹理错位,而且对高度专业的工程结构,比如精确的建筑力学模型,还无法做到精准生成。它更像一个超级助理,把最耗时、最重复的建模工作接手,让创作者把精力放在创意和细节打磨上——比如游戏开发者不用再花几个月建森林地形,而是直接用AI生成的基础场景,专注设计隐藏在树后的宝箱和怪物AI。
更值得关注的是,这不是一次单纯的技术升级,而是AI从“理解语言”到“理解物理世界”的关键一步。当AI能生成符合物理规律的3D空间,它的应用边界会从游戏、影视延伸到更务实的领域:建筑师可以快速生成不同设计方案的虚拟空间,让客户直接“走进去”体验;机器人可以在AI生成的无数虚拟场景里训练,不用再依赖昂贵的真实环境;甚至城市规划师能通过AI生成的虚拟城市,模拟不同交通方案的通行效率。
从画一张图到造一个世界,AI正在把“空间”变成一种可编辑的语言。未来我们谈论的可能不再是“AI生成了一张图”,而是“AI帮我构建了一个能住进去的想象”。而这,只是AI理解物理世界的开始。
点击充电,成为大圆镜下一个视频选题!