路口开始思考，谁为它的错误买单？

谁下指令，谁先买单。若路口的I-WM直接改了信号配时、下发“强制性”V2X指令，导致事故，运营管理方（交管部门或受托运营商）构成首要责任，再按产品缺陷或服务过错向软硬件供应商追偿。若路侧仅发“建议性”预警而最终决策在车端，责任仍以车辆一方为主，除非能证明显失准预警已误导尽责驾驶/系统。账怎么分？靠合同、保险与取证三件套。把检测准确率、失效模式与降级策略写进SLA，约定误报/漏报红线；运营方配公共责任险与网络安全险，设备商配产品责任险，建立联合理赔与追偿链；强制“路口黑匣子”与车端EDR统一时标与签名，支撑事故复盘按比例分责。达成功能安全/SOTIF与网络安全合规可获有限“安全港”，但隐瞒数据将触发加重责任。底线很清楚：错给“绿灯”或发“误导性指令”——路侧先赔；只发风险提示而车端作主——车辆一方担主责。要少买单，路口必须可关闭、可降级、可审计，让每一次错误都能被看见、被切断、被追责。

AI会学会并固化“交通恶习”吗？

会。如果只用人类行车日志做模仿学习，模型会把违规与激进行为一并吸收，并在分布外场景放大“捷径”（如跟车忽视限速、黄灯抢行）。这源自统计相关替代因果、曝光偏差与奖励错配，开环评测里常见“无碰撞但高风险”的策略被学会并重复。破局不靠删数据，而是重塑“何为好驾驶”。用基础设施的上帝视角挖掘并标记近失险、抢行、加塞样本，做去偏与重加权；在目标里加入物理与法规硬约束（控制屏障函数、TTC/PET风控、约束强化学习），再用安全偏好数据与语言化规则做“审计官”；上线以安全盾在执行前拦截违规动作，并借V2X获取信号相位与盲区情报，降低被诱发违章的几率。世界模型还能做反事实评估：同一场景模拟“如果不抢行”的后果，用风险价差约束策略更新。所以答案不是“学不学”，而是“学了能不能改”。把人类数据当原料而非金标准，用基础设施与世界模型给行为定价，AI会学到可复制的安全，而不是可复制的陋习。

能把东京路口的“大脑”移植到纽约吗？

短答：能“移植”，但绝不是拷贝粘贴，而是“带脑换血”。I‑WM里可通用的层主要是几何重建、占据预测、基本动力学与不确定性建模，这些在纽约同样奏效；必须重学的是行为先验与规则因果——东京是左侧通行、常见行人全向放行与高秩序礼让，纽约是右侧通行、相位与转向优先级、车队与行人决策节奏都显著不同，连SPaT编码、标线语义和车辆构成也换了风格。实操上更像“三步走”的器官移植。先冷启动：接入本地SPaT与车道拓扑，仅启用几何/动力学子模块，输出改为“只读”预测。再在线自监督适配：用路口多模态流量的连续数据把轨迹分布、行人过街时机、冲突先验校准到纽约风格，配合不确定性门限与概念漂移检测，防止早期误报。最后做因果对齐与少量人类先验注入：把“谁先走”显式写成因果变量（相位、让行、优先道），用少量带噪标签或弱规则快速锚定。等到分布差异收敛、TTC/PET等安全分位与实测误差进入阈值区间、预警的误报/漏报达标，再从“影子模式”切到有限度主动干预。换句话说，东京的大脑提供了骨架与直觉，纽约需要的是本地记忆与街头气质。做对了，几天到数周的无标注适配就能让它说一口“纽约腔”；做错了，一键上岗只会把聪明变成冒失。

新知 - 大圆镜｜自动驾驶卷错了方向？路侧传感器才是真大脑

对抗知识焦虑，从看懂这条开始

App 下载

时空互补：单车是网，路侧是井

你可以把车载传感器想象成一张撒开的网——它能跟着车跑遍大街小巷，见识各种路况，但在每个路口都只能停留几分钟，像蜻蜓点水；而路侧传感器是一口深扎在路口的井，它不挪窝，但能连续几年盯着同一个地方，把早高峰的右转车流规律、雨天行人闯红灯的概率、甚至三年一遇的惊险避让都记下来。

这种“时空互补性”，正是I-WM的核心逻辑：车载模型管“微观”——精准感知车身周围的细节；路侧模型管“宏观”——掌握整个路口的长期行为模式。两者结合，才能既看到眼前的车，也预见三分钟后可能窜出来的人。

更关键的是，路侧传感器能积累车载传感器一辈子都碰不到的“稀有样本”——比如一辆车在绿灯时突然急刹、行人突然从绿化带窜出。这些极端场景是自动驾驶最需要的训练数据，却恰恰是单车最难碰到的。

双层架构：从“看”到“想”的两步走

要让路侧传感器从“监控器”变“大脑”，不能直接把车载模型搬过来。麻省大学的团队设计了一套务实的双层架构：

第一层是“无标注感知引擎”——先解决路侧数据的痛点：没人能给每个路口的每帧数据都手工标注车辆和行人。这一层用无监督算法自动分离背景和移动物体，给每个检测到的目标打上“置信度标签”——比如远处被遮挡的车，可信度只有60%；雨天的激光雷达数据，打个80分。这些带“靠谱程度”的结构化数据，就是喂给上层的“营养餐”。

第二层是“生成式世界模型大脑”——它像一个内置的交通模拟器，用扩散模型和自回归算法，根据过去10秒的观测，预测未来15秒的路口场景：哪辆车会变道，行人会不会闯红灯，甚至能推演“如果刚才的货车没刹车会怎样”这种反事实场景。为了不让AI脑补出“汽车穿墙”的离谱画面，模型还加入了物理约束——比如车辆的加速度不能超过物理极限。

这种“脏活累活”和“高级智能”分离的设计，既满足了路侧部署快速、免标注的现实需求，又让AI能在高质量数据上高效学习。

从实验室到路口：五年路线图与现实挑战

这篇论文最难得的是不画饼，给出了一份五年三阶段的落地路线图：

第一阶段1-2年，先搞定“看懂”——用现有3D生成模型，把路侧激光雷达和摄像头的数据变成高保真的数字场景；第二阶段2-4年，学会“预测”——加入物理约束和强化学习，让AI能模拟信号灯变化对车流的影响，甚至帮交通管理部门测试不同的配时方案；第三阶段4-5年，实现“协同”——让车和路的世界模型“脑洞对齐”，车能瞬间获取路侧积累的经验，路侧也能理解单车的局部细节。

但理想和现实之间隔着不少坎：首先是成本，一个路口要装激光雷达、摄像头、4D雷达，再加上跑模型的计算单元，成本是车载传感器的好几倍；其次是隐私，路侧摄像头盯着路口，会不会泄露行人的隐私？还有跨路口的泛化——一个路口学来的规律，放到另一个完全不同的路口还能用吗？

更值得关注的是，这套系统的用户不只是自动驾驶车，更是整个交通系统：它能提前预判碰撞，联动信号灯延长红灯避免事故；能模拟路口改造方案，帮规划者选最安全的设计；甚至能给救护车开“绿波带”，让急救时间缩短几分钟。

当我们还在争论单车自动驾驶什么时候能完全替代人类司机时，I-WM的思路像一扇新打开的窗：自动驾驶的终极目标，从来都不是让每辆车都变成“老司机”，而是让整个交通系统变得更聪明、更安全。

未来的路口可能不再是冰冷的信号灯和摄像头，而是能主动思考的“智能节点”——它记得这个路口所有的故事，能预见可能的危险，还能和路过的车、等待的人“对话”。

从单车智能到路网智能，才是自动驾驶的终极答案。

时空互补：单车是网，路侧是井

双层架构：从“看”到“想”的两步走

从实验室到路口：五年路线图与现实挑战

评论