AI会有自己的“牛顿定律”吗？

会，但更可能是一组“定标律+稳定性律”，而非三条公理。神经定标律已在多模态复现：测试损失随模型、数据、算力按幂律平滑下降；算力最优点要求参数与训练token按近似固定比例配置（常用约20:1），可据此反推达到目标误差所需的数据与预算。训练动力学也呈“准定律”：SGD的各向异性噪声偏向平坦极小值；深网常在稳定性边缘运行；残差连接把李雅普诺夫指数压近1以避深度灾难；Transformer在稀疏长记忆上优于RNN，构成长记忆标度规律雏形。这些已沉淀为可操作的上/下界与设计准则。真正的“牛顿时刻”，是把上述经验律上升为第一性原理：用函数逼近解释高维可学性，用统计物理刻画能量景观与相变，用信息论连接压缩与泛化。届时，给定目标与预算，先验算出最优架构、规模与训练日程将成常规。

AI不“自言自语”会憋坏吗？

不会。这里的“自言自语”指显式链式思维文本（把中间推理写出来）。它是提高可解性的工程手段，不是模型“活着”的前提。禁掉输出不会让模型“憋坏”，但会改变性能、成本与安全的权衡：显式CoT常能提升数学与逻辑题的准确率，却会带来2-5倍的令牌开销，并暴露推理策略、增大越狱与数据泄露风险。行业正在转向“想得多，不一定说出来”的隐性思维路线：隐藏式思维痕迹、内部scratchpad与专用标记、结果验证器+多样采样、自洽投票、程序化工具推理（PoT）、以及基于验证的强化学习。实践表明，这些方法在不公开步骤的前提下，往往能保留甚至超过显式CoT带来的收益，同时更省钱、更安全。真正会“掉链子”的是禁止模型内部展开推理且不给任何替代支持：不增采样、不用检索/外部记忆、不做过程或结果奖励，在长程依赖与“推理步数灾难”情形下性能确实会下降。补救之道是给它可验证的反馈、适度的测试时搜索、工具与记忆组件，或让路由机制把难题分给合适的“专家”。结论：AI不需要“自言自语”，它需要的是可用的推理信号与计算预算；说不说，只是呈现形式。

AI的“黑箱”真的必须打开吗？

答案不在“全开”或“全关”两极。黑箱不必对所有人彻底打开，但必须做到对关键对象“可被打开”：对监管与独立审计可审计、对被决策个体可解释与可申诉、对社会可验证与可追溯。欧盟AI法案已对高风险场景强制风险管理、日志与技术文档；我国算法备案与生成式AI办法要求目的、数据来源与评测披露；美国则强调NIST风控与政府报备。这些都指向同一结论：按风险分级、按对象分层透明，优先解决可责性而非强求公开权重与源码。可行做法有现成工具链：用模型卡/系统卡披露训练数据类别、能力边界与已知失效；建立算法影响评估与第三方红队、压力测试；全程留痕与版本化，支持事后复盘；对用户提供可操作的反事实解释和申诉通道；对监管在安全沙箱内披露细节或用零知识证明、差分隐私等实现“证明而不泄密”；用数据溯源与内容标记（如C2PA、水印）抑制投毒与误导。透明也有代价：被对抗、羊群效应、知识产权受损。缓解之道是分层披露、延迟披露与聚合级别指标，只公开行为约束与评测证据而非可被复刻的实现细节。归根到底，真正需要“打开”的不是每一行参数，而是问责链条：能被质疑、能被复核、能被纠错。在信贷、就业、医疗、司法等高风险领域，黑箱必须能打开；在低风险生成与辅助创作场景，做到可验证与可控即可。

新知 - 大圆镜｜AI要告别试错，得先过这几道数学关

大圆镜

内容由AI生成，思考得你完成

App Store 下载 Android 下载

从“盲人摸象”到破解维数灾难

你可以把传统算法想象成一群在黑屋里摸大象的盲人：摸到腿说是柱子，摸到耳朵说是扇子，永远拼不出完整的象。这就是“维数灾难”——当问题的维度超过两位数，比如一张32×32的彩色图片有3072个像素维度，传统数学方法就会彻底失效：计算量会像爆炸一样指数级增长，再多的算力也填不满这个窟窿。

但深度学习打破了这个魔咒。1993年数学家Andrew Barron提出的Barron空间理论证明，只要函数满足特定的傅里叶谱性质，两层神经网络就能用和维度无关的误差逼近它——就像给盲人每人配了个对讲机，他们能把摸到的局部信息拼出完整的大象。蒙特卡洛积分的思路更直白：把高维函数逼近转化为随机采样的积分，就像用撒豆子的方法算圆面积，豆子撒得越多，结果越准，和圆的大小（维度）没关系。

这不是玄学，是硬邦邦的数学：深度学习的逼近误差只和网络宽度成正比，和维度无关。这就是AI能处理图像、语言等高维问题的核心原因。

推倒“深度墙”和“记忆墙”

解决了维数灾难，AI又遇到了新的坎：“深度灾难”。就像传话游戏，一句话经过十个人就会变味，深度学习的梯度信号在经过几十层网络后，要么衰减到消失，要么膨胀到爆炸，导致深层网络根本训不动。

2015年残差网络（ResNet）的出现，给梯度开了个“绿色通道”：它不直接学输入到输出的完整映射，而是学输入和输出的“残差”——就像你不用记住整本书，只需要记住和上一版的区别。恒等映射的跳跃连接让梯度能直接从输出层传到输入层，彻底解决了梯度消失的问题。现在，几百层的神经网络能像搭积木一样轻松训练。

另一道坎是“记忆灾难”：循环神经网络（RNN）处理长文本时，就像鱼只有7秒记忆，前面的信息走着走着就丢了。Transformer的自注意力机制则像给每个词配了个放大镜，能直接看到整个文本里的所有词，不管隔了多少行。它的计算复杂度和序列长度的平方成正比，而RNN是线性的——这意味着Transformer能轻松处理几万字的长文本，而RNN连几千字都费劲。

从算法到系统：AI的科学化蓝图

当单个算法的理论基础逐渐清晰，科学家开始把AI当成一个复杂系统来看待。就像一架飞机，不能只优化发动机，还要考虑机翼、尾翼和控制系统的协同。AI系统也一样，它包括大模型内核、分层记忆体系、外部接口和环境交互四个部分。

比如“忆立方”模型，它把AI的记忆分成了四层：感官记忆负责即时捕获输入，工作记忆负责当前推理，情景记忆负责跨会话的短期记忆，语义记忆负责长期存储知识库。这种分层设计解决了传统AI“记不住事”的问题——就像你大脑里的临时记事本和永久藏书阁，各司其职。

AlphaGeometry则是神经符号混合系统的典范：大模型负责猜辅助线怎么画，符号引擎负责用几何定理严格证明。这种“AI找思路，人类讲逻辑”的协作模式，让AI能解出国际数学奥林匹克竞赛的几何题，性能接近人类金牌选手。

但AI的科学化还有很长的路要走：我们还不知道深度学习的泛化能力到底来自哪里，非结构化数据的建模还没有统一框架，AI的创造力还远不如人类的工程直觉。

从AlphaFold预测蛋白质结构，到DeePMD实现量子精度的分子模拟，AI正在从“经验工具”变成“科学方法”。它不再是黑箱里的魔法，而是有数学理论支撑、有系统框架约束的科学体系。

“AI的科学化，是从‘试错’到‘理解’的跨越。”这不仅是技术的进步，更是人类认知的升级。当我们能真正理解AI为什么能行，我们才能让它更可靠、更安全、更能解决人类面临的复杂问题——从气候变化到疾病治疗，从新材料研发到深空探测。AI的未来，不是让它变成另一个人类，而是让它成为人类探索未知的最强大工具。

从“盲人摸象”到破解维数灾难

推倒“深度墙”和“记忆墙”

从算法到系统：AI的科学化蓝图

评论