新知 - 大圆镜｜谷歌把时间拆成补丁，预测准确率提30%

Q: 用“噪声”训练AI，能预测“黑天鹅”吗？

用“噪声”训练（如扩散/去噪）能学到序列的随机波动和一定的重尾形状，但它并不能“预测”黑天鹅。黑天鹅往往来自制度突变与外生冲击，属于分布外、机制外的不确定性；噪声训练主要刻画分布内的随机性（aleatoric），对认知不确定性（epistemic）无能为力。历史里若没出现过可比极端，模型既学不到其概率，也给不出可验证的路径。 更现实的路径不是赌“能预测到它”，而是“能量化并预演它”。做法是：用分位数/分布预测将区间拉到高分位（如99.5%+），再用极值理论对阈值以上尾部外推，并配合保序与覆盖校准；用扩散模型合成受控压力情景（放大波动、扭转相关、叠加跳跃）做资产与业务的压力测试；同时以变点检测与因果/协变量信号捕捉早期迹象。这样或许锁不定时间与形态，却能提前定价、设限与对冲黑天鹅。

Q: AI能预测股价，能预测下一首神曲吗？

能，但别把它当水晶球。对股价，AI更擅长给“概率与区间”，而非“点位与必然”。短周期里它能识别条件分布、波动和市场状态切换，却很难跨越突发新闻与非公开信息的壁垒；任何稳定可复制的超额收益都会被套利削平。更稳妥的用法是分位数/情景预测、交易执行与风险控制；仅靠价格序列远远不够，需叠加订单流、新闻情绪、宏观协变量，并严防回测过拟合与数据泄露。 至于“神曲”，预测的是“走红几率”，不是“下一首就它”。未发布阶段仅凭音频特征可预测性很弱；一旦上线，首24–72小时的互动数据、社交扩散轨迹与歌单曝光会让可预测性陡增，此时常能提前1–3周捕捉爆款趋势，但仍难精确点名。最佳路径是多模态融合并用级联/生存模型刻画扩散。生成方面，AI能写“模板爆款”，却容易陷入好听但同质的Goodhart陷阱，必须用A/B与投放实验校准。

Q: AI“算命”，下一步是“改命”吗？

能。把“算命”变成“改命”的关键，是把预测接进因果与优化的闭环里：先用模型给出分布而不是点（如分位数/连续分位支持把风险露出来），再把“可控变量”显式喂给模型（价格、投放、排班等），最后用约束优化或控制器去选动作。实践里，动态定价、灵活排班、需求响应这类策略，常能在成熟场景里带来个位数到十几百分点的成本下降或服务水平提升；分位数驱动的库存与运力配置，配合CVaR等风险目标，更能把极端情况的损失收窄。这不是玄学，是把预测的“会怎样”转成决策的“该怎样”。 但真要“改命”，最难的不是更准的预测，而是因果与安全。仅凭相关性的预测去行动，极易触发古德哈特效应：一旦指标被优化目标化，它就不再代表你以为的东西。要稳妥改写未来，得识别“如果我做X，会多出来的因果增益”——用A/B实验、提升建模、结构因果图或自然实验来估计个体化效应；在无法全面试验时，用离线策略评估（逆倾向加权、双重稳健）先算清风险再小流量上线；同时准备数字孪生与回放仿真，防止策略把分布本身改坏，配上硬约束、保守探索和一键回退。 一条务实路径是：以强力时序模型打底拿到不确定性；基于“可控变量”的反事实沙盘跑“如果……会怎样”；在约束下用MPC/鲁棒优化/保守RL搜策略；小步快跑、持续监控漂移与反作用，再按反馈迭代模型与策略。当推理够快、可控量够清晰、因果证据充足，AI确实能“改命”——改的不是宿命，而是你对系统的策略与激励，从而改变结果分布。

对抗知识焦虑，从看懂这条开始

App 下载

当电商新品只有3个月销售数据，当供应链突然遭遇疫情冲击，当电网要预判极端天气下的负荷波动——传统预测模型往往束手无策，要么缺数据，要么跟不上突变。谷歌团队的TimesFM模型，却能在没见过这类数据的情况下，给出比传统方法准30%的预测结果。它不用针对每个场景重新训练，甚至能一次性预判未来1000个时间点的波动区间。这背后，是一种把时间序列「拆成补丁」的全新思路。

把时间切成补丁，像处理语言一样预测

你可以把时间序列想象成一篇没有标点的长文，传统模型是逐字逐句读，遇到长句子就容易忘前面的内容。而TimesFM做了一件关键的事：把连续的时间点切成固定长度的「补丁」——就像把长文分成段落，每个补丁包含32个时间点的信息。

这些补丁会被编码成向量，再送入类似GPT的解码器架构。和语言模型学习词语间的关联一样，它在1000亿个真实时间点的预训练数据里，学习不同补丁之间的时序规律：比如销售数据里「618大促」补丁后通常跟着「订单暴涨」补丁，电网数据里「高温预警」补丁后是「负荷峰值」补丁。

但真实的机制比这更精确：它采用因果自注意力机制，确保预测时只看「过去的补丁」，不会提前泄露未来信息；还能让输出补丁的长度远大于输入补丁，比如用32个时间点的历史，一次性预测128个时间点的未来，直接解决了传统逐步预测的误差累积问题。

零样本预测，解决冷启动难题

传统时间序列模型的死穴是「冷启动」：新产品、新业务没有足够历史数据，模型根本无法训练。TimesFM的核心突破，就是靠大规模预训练获得了「零样本预测」能力——不用针对新场景微调，直接就能给出靠谱结果。

它的预训练数据覆盖了搜索趋势、零售销售、交通流量、电力负荷等10多个领域，从分钟级到年级的时间频率都有，甚至还加入了合成数据模拟极端场景。这让它学会了通用的时序「语法」：不管是销售数据的季节性，还是电网数据的周期性，它都能快速识别。

2025年谷歌又推出了「上下文微调」技术：推理时输入几个类似的时间序列示例，比如用同品类其他产品的销售数据当参考，就能让预测精度再上一个台阶，性能接近专门训练的模型，但不用改动任何模型参数。

当然它也有局限：面对金融崩盘、疫情冲击这种极端罕见的「黑天鹅」事件，因为预训练数据里样本太少，它的预测误差还是会大幅上升；而且目前对跨变量的关联建模，比如同时预测气温和空调负荷，能力还偏弱。

不止预测数值，还要给出波动区间

和只输出一个预测数值的传统模型不同，TimesFM 2.5版本加入了一个3000万参数的「分位数预测头」，能输出从10%到90%的连续分位数预测——简单说，它不仅告诉你「明天销量大概是1000件」，还会告诉你「有90%的概率在800到1200件之间」。

这个功能对业务决策至关重要：零售企业可以根据90%分位数设定安全库存，避免缺货；金融机构能靠分位数评估风险，设定止损线。它解决了长期以来时间序列预测的痛点——只给确定数值，却不告诉用户这个预测的靠谱程度。

同时，2.5版本还把模型参数从5亿砍到了2亿，上下文长度从2048拓展到16384，既能捕捉更长周期的规律，比如识别产品的年度销售趋势，又大幅降低了推理成本，甚至能在普通CPU上快速运行。

当我们谈论时间序列预测，本质上是在和不确定性博弈。从早期的ARIMA统计模型，到后来的LSTM深度学习，再到今天的TimesFM基础模型，人类对时间的理解正在从「拟合规律」转向「学习规律」。

TimesFM的意义，不止是把预测准确率提了30%，更是打破了「每个场景都要单独建模」的固有思路。预训练一次，通用所有场景——这种模式正在把时间序列预测从专家专属的复杂技术，变成普通人也能快速用上的工具。未来的智能决策，或许就藏在这些被拆成补丁的时间片段里。

脉络

1964年

Arnold D. Kerr在冷区研究与工程实验室提出弹性与粘弹性基础模型，对时间序列建模的理论基础提供了早期的数学支持，推动了后续预测模型的理论发展。

1971年

D. J. Bartholomew和M. G. Kendall等人出版《Time Series Analysis, Forecasting and Control》，系统梳理了时间序列分析与预测的基础方法，对ARMA模型等奠定了理论基础。

1977年

Michael D. Geurts与Beat Kleiner等人共同推动ARIMA模型在实际预测中的应用，使Box-Jenkins方法成为时间序列预测领域的标准方法论。

1978年

O. D. Anderson在统计学领域对时间序列的预测与控制理论进行了进一步总结与推广，加强了统计建模方法的实用性与理论深度。

1990年

Andrew Harvey出版《Forecasting, Structural Time Series Models and the Kalman Filter》，首次系统引入结构时间序列模型与卡尔曼滤波，极大拓展了动态建模的应用场景。

1990年

George Sugihara提出非线性预测方法，区分混沌与测量误差，为复杂系统的时间序列预测提供了新工具，推动了非线性动力学在该领域的应用。

2002年

Peter J. Brockwell出版《Introduction to Time Series and Forecasting》，以严谨与易懂的方式普及了时间序列建模与预测基础，成为全球重要教材。

2003年

G.Peter Zhang提出将ARIMA与神经网络混合用于时间序列预测，显著提升了非线性序列的建模能力，推动了神经网络在该领域的应用。

2003年

Kyoung-jae Kim将支持向量机（SVM）引入金融时间序列预测，验证了SVM在高噪声数据中的有效性，扩展了机器学习在预测领域的应用。

2008年

Rob J. Hyndman开发并发布R语言forecast包，实现了时间序列预测的自动化，极大促进了统计建模工具的普及和应用。

2020年

Zonghan Wu团队提出将图神经网络应用于多变量时间序列预测，有效捕捉变量间复杂关系，推动了深度学习在该领域的进步。

2021年

Haoyi Zhou团队提出Informer模型，提升了长序列时间序列预测的效率和准确率，推动了Transformer结构在序列预测中的应用。

2023年

Ailing Zeng团队系统评估了Transformer在时间序列预测中的有效性，揭示了其优势与局限，为后续模型设计提供了理论依据。

2026年

Mauro A. Gonzalez-Sierra提出Shape-Preserving Minimum Trace（SP-MinT）方法，实现了层次型时间序列预测的一致性与形状保持，提升了复杂场景下的预测精度。

2027年

BERNA ÇALIŞKAN发布《Time Series Forecasting with Prophet using Python coding》，推动Prophet模型在Python生态中的应用与普及，便于非专业用户高效实现时间序列预测。

把时间切成补丁，像处理语言一样预测

零样本预测，解决冷启动难题

不止预测数值，还要给出波动区间

评论