除了看清，能否重建一场大雾？

能。把“看清”升级为“重建大雾”，本质是把场景里的参与介质当成一等公民去求解：恢复体素化的消光系数（雾密度）、单次散射反照率以及相函数（常用Henyey–Greenstein的g）。用可微体渲染把它们和表面几何一起反演，多视角序列就能拟合出一张随空间变化的“雾场”，再在新视角、乃至新光源下重渲染车灯光束、体积光柱、远近能见度，做到不止除雾，还能“回放与改编”那场雾。要把这事做稳，需要比“先除雾后泼溅”更多的观测与先验：相机的辐射定标与曝光对齐，已知或可估的环境光分布；深度或透射率先验（LiDAR/ToF的回波衰减可直接约束Beer–Lambert）；偏振相机可分离气溶胶散射分量以锁定相函数；时间序列还能用质量守恒/对流方程做物理正则，把密度随时间的演化和速度场一起学出来（对应到4D NeRF/4D高斯泼溅的介质分支）。实测里，采用“表面+介质”的联合反演，配合平滑与高度相关的先验，通常能恢复到足以驱动仿真与新光照的中等分辨率雾体；新视角PSNR在18–22 dB区间并不罕见，体积光效一致性亦可控。难点也很现实：单次环拍、固定光照下，表面反照率与雾密度存在固有可辨识性歧义；极端浓雾让多视角几何锚点稀缺，介质与表面解耦更难。没有额外传感与物理先验时，你多半只能得到“有效雾场”（在当时光照下等效成立），而非可任意重光照的物理忠实雾体。换言之，想“重建一场大雾”，今天已可行，但要从影视级到应急仿真级分别达标，投入的观测信号与物理约束也得同步升级。

AI去雾看路，会造出幻影吗？

会。若把“生成式去雾”直接放在感知前端，它会在雾最浓的地方“脑补”边缘、车道或行人，跨帧/跨视角还常不一致，进入3D重建与跟踪后被平均或漂移，形成“幽灵障碍物”或把真实目标抹掉。更糟的是，PSNR再高也不等于安全：逆光、湿路反射、远处尾灯等场景里，误报与漏报都会被放大。要把“幻影”压到最低：用物理可逆的去雾（显式散射模型、透射图/暗通道约束），或给生成模型加“几何不可改”的硬约束与跨帧/跨视角一致性（光流、极线、深度分布一致）并做全局亮度对齐；感知上走并行分支与不确定性门控，高不确定时回退原始图/保守策略；用激光雷达、毫米波、热成像/HADAR做交叉佐证与冲突仲裁；评测用误报/漏报成本、检测稳定性与轨迹抖动，而非只看PSNR/SSIM。

AI的脑补，和人脑有何不同？

本质上，AI的“脑补”是统计外推：在见过的数据分布里采样最可能的填空；人脑的“脑补”是预测编码的闭环推理：大脑用内在世界模型先验去预言感知，再用多模态误差信号（视觉、前庭、本体感觉）即时校正。于是人脑能无缝填补盲点、在走路时稳住视觉，而AI在缺乏传感与行动反馈时更易生成与现实脱耦的内容。差异还体现在效率与不确定性处理。人脑约20W功耗，每秒可进行约10^15级别突触事件，单次事件能耗~10^-14焦；主流AI要以百到千瓦支撑训练与推理，单次算子能耗高两个数量级。儿童在百万级词汇与少量交互中即可一举多得地归纳因果与物理常识；大模型往往需万亿级token。人脑用群体编码与去甲肾上腺素、乙酰胆碱等神经调质表达与调节不确定性，决定“该相信先验还是证据”；AI多数给出点估计，校准性不足。记忆与目标函数也不同。人脑有“快—慢”双系统：海马体快写入、睡眠重放巩固到皮层，并在多巴胺奖惩信号下进行结构性更新；AI多依赖离线数据上的单一损失（如交叉熵）与批量梯度下降，缺少睡眠式重组与任务驱动的可塑性门控。要让AI的“脑补”更像人脑，关键是引入具身闭环、显式不确定性与“睡眠式”巩固机制，让生成既有想象力也受物理与因果约束。

新知 - 大圆镜｜先除雾再泼溅，破解3D重建的视角矛盾

大圆镜

内容由AI生成，思考得你完成

App Store 下载 Android 下载

先把雾扫干净，再谈怎么拼积木

你可以把3D重建理解成用多视角照片拼3D积木——每张照片都是积木的一个侧面。过去的做法要么是先把每张照片都修到最清晰，结果各侧面颜色纹理对不上，拼出来的积木歪歪扭扭；要么是强行让所有照片保持一致，结果每张都修得模糊不清。

这个团队反其道而行之：第一阶段就把单图去雾做到极致。他们调用了谷歌Gemini系列的生成模型，给每张烟雾照片独立“美颜”，单帧去雾的峰值信噪比（PSNR）达到20.07dB——这意味着单看每张图，几乎和无雾的真实场景没差。但代价也很明显：不同视角的照片亮度能差出0.12，就像有的在正午拍，有的在傍晚拍。

于是他们加了关键一步：亮度标准化。把所有照片的亮度、颜色分布对齐到同一个基准——有真实无雾图就对齐真实图，没有就取所有照片的中间值。这就像给所有积木刷上了统一底色，虽然局部纹理还略有差异，但至少不会出现“一半黄一半红”的尴尬。

用物理规则，把积木钉成牢固的整体

接下来是第二阶段：用3D高斯泼溅渲染（3DGS）拼积木。这是近年大火的3D重建技术——简单说就是用成千上万个带颜色和透明度的3D“高斯球”当积木，快速拼出高质量的3D场景。但如果直接把第一阶段的“伪干净”照片喂进去，3DGS会彻底懵圈：同一个3D点，不同视角给的颜色不一样，它只能取平均值，结果拼出来的场景模糊得像打了马赛克。

团队的妙招是给3DGS套上三个“物理紧箍咒”：

第一个是深度监督损失。他们用对烟雾鲁棒的深度估计模型，从原始烟雾图（不是去雾后的图）里算出场景的“骨架”——伪深度图，要求3DGS拼出的场景骨架必须和这个伪深度图高度匹配。这就像先搭好积木的钢筋骨架，再往上贴颜色，不管颜色怎么变，骨架不会歪。

第二个是暗通道先验正则化。这是去雾领域的经典物理规则：无雾的清晰图像里，每个局部小块总有一个颜色通道接近黑色。他们用这个规则约束3DGS，一旦渲染出的图像局部不够暗，就惩罚模型，逼它把残留的雾效彻底去掉。

第三个是双源梯度匹配损失。虽然不同视角的颜色可能不一样，但物体的边缘轮廓是一致的。他们用另一款去雾模型的输出当“素描稿”，要求3DGS渲染出的边缘必须和素描稿对齐，保住场景的细节骨架。

更绝的是训练策略：他们发现如果让3DGS的高斯球数量无限制增长，模型会“死记硬背”每张图的局部差异，反而拼不出统一的场景。于是他们提前停止增加高斯球，用MCMC（马尔可夫链蒙特卡洛）策略动态调整高斯球的密度——就像只给模型刚好够拼场景的积木，逼它去学通用的3D结构，而不是纠结局部的颜色差异。

数据说话：1.5dB的跨越意味着什么

在Akikaze验证集的测试里，这套“先除雾后泼溅”方案的PSNR达到20.98dB，比没有物理约束的基线方法整整高了1.5dB——在图像质量评价里，超过1dB的提升就是质的飞跃。

你能直观看到差异：基线方法渲染出的场景模糊偏色，玩偶的面部细节几乎看不见；而这套方案渲染出的场景，颜色和真实场景几乎一致，棋盘格的纹理、玩偶的睫毛都清晰可见。更有意思的是，团队尝试过去做端到端的模型——把去雾和3D重建合在一起训练，结果PSNR只有10.28dB，几乎是“五彩斑斓的垃圾”。这恰恰证明了他们的判断：单图去雾和多视角一致性，根本没法在同一个模型里兼顾，分阶段处理才是最优解。

当然，这套方案也有局限：它依赖外部生成模型的API，成本和稳定性都是问题；针对不同烟雾密度、不同场景，超参数还得手动微调。但不可否认的是，它精准命中了3D重建领域的核心矛盾，给出了一套务实、可复现的解决方案。

当我们为AI的“端到端魔法”欢呼时，这套“先除雾后泼溅”方案像一个冷静的提醒：有时候，把复杂问题拆成两步，用最成熟的工具解决每一步，再用物理规则把它们粘起来，反而比追求“大一统”的模型更有效。

分而治之，用规则弥合矛盾。这句话不仅适用于3D重建，也适用于很多看似无解的技术难题。未来，我们或许能看到更聪明的模型——既能把单图修得清晰，又能自动保持多视角一致，但在那之前，这套方案已经给了我们一个足够好用的梯子，让我们能先爬上浓雾中的3D重建高地。

先把雾扫干净，再谈怎么拼积木

用物理规则，把积木钉成牢固的整体

数据说话：1.5dB的跨越意味着什么

评论