AI“白菜价”后，谁来买单？

看起来是用户捡了便宜，实际上账单被转移：头部厂商与云巨头在以亏损换规模，资本先埋单；企业侧在高价值环节补票。推理已占AI应用总支出约70%，推理算力需求占比逼近72.6%；2025年一季度全球云厂商资本开支约766亿美元。OpenAI 2024年亏损约50亿美元，国内多家年亏数十亿到百亿级，价格战的差价都被这些口袋兜住了。企业真正付费的也不是token，而是“结果”：私有化与SLA、合规与数据驻留、长上下文缓存与向量库、工作流编排与Agent平台、专线带宽与运维，这些才是大头。芯片与算力厂商靠薄利与政府/产业基金采购摊销成本，换装机与生态位。归根结底，买单的是能把AI变现的一侧——资本先期、B端长期；C端只是阶段性享受补贴，直到出清后价格回归价值。

AI变“笨”了，反而更有用了？

是的，更“笨”却更有用。这里的“笨”，是单次回答更不保守、事实回忆略差；但它把Token成本压到前沿闭源的约1/6–1/7、给到百万级上下文与更强工具调用。对企业有用性的度量是“单位预算下的任务完成率”，而非一次命中率：若单次成功率70%，做3次自一致+校验，综合成功率≈97.3%，总成本仍更低。长上下文把“读→检索→规划→执行”粘在一条链上，便宜的Token让外部搜索、数据库校验、严格Schema、失败重试、投票集成成为常态工程。于是“敢说敢试”的模型不再可怕，错误被验证器拦截、被重试稀释，反而更能把复杂多步任务跑通；而更贵更准的闭源模型，难以在长链高并发里铺开。当然，零容错场景别迷信“便宜+重试”——高风险问题路由给更强模型或人工复核，把大多数中低风险自动化交给“便宜+脚手架”的组合。当评价单位从“答案是否完美”变为“系统是否完成目标”，你会发现：变“笨”的AI，恰好更实用。

AI用上“中国芯”会怎样？

短期最直观的变化是成本曲线继续下砸。国产NPU批量上线后，长上下文与高并发场景的单位Token成本有望再降30%-60%，边缘与私有化部署的整体TCO同步下探，合规与数据驻留更轻松。当百万级上下文变成“标配且便宜”，企业会少做索引与裁剪，直接把整库代码、整卷档案丢给模型推理，产品形态随之改写。技术路线也会微调：模型更偏稀疏化、低位宽量化与压缩KV，优先适配专家并行与大批处理；工具链向“多芯片可移植”收敛，API层保持OpenAI兼容以降低迁移摩擦。商业格局将出现双生态并行——闭源高价与开源低价并存，调度层按最低TCO在不同芯片间动态路由。风险与边界同样清晰：训练侧仍是短板，通信库、算子完备性与精度回归需要时间，早期可能以稳定为先牺牲通用性。大规模部署初期会经历一次“软件生态阵痛期”；更乐观的节奏是，推理端今年补齐，训练端要看到同量级替代，大概率在2027年前后。一旦规模站稳，AI的价格“地板”会被永久改写，像电力一样按量取用、无处不在。

当AI像水电一样便宜时会怎样？

当AI像水电一样便宜，API不再是“生意”，利润中心会转移到数据、分发与“脚手架”。企业会启用多模型调度：常规任务用高性价比开源，自检失败才升级到旗舰；长上下文与KV压缩把单Token成本压到前沿模型的1/6–1/7，但总账未必下降，因为每个任务的token用量在膨胀，更多流程被全量记录与回放，Agent从试验品变成流水线“工人”。组织形态会先改而非岗位瞬间消失。知识工作被拆成可验证子任务，人定义目标与约束，Agent负责执行与回溯，SLA、审计日志与“事实/创造”模式切换成为新规。工具调用与幻觉由验证器、外部知识、严格Schema、自一致性投票兜底，失败自动重试；AI从“提示词魔法”升级为可观测、可治理的“AI运维”。基础设施逻辑外溢到能源与供应链。推理成本的80%系显存，KV缓存是大头，算力加速向本地化与绿电迁移，边缘部署减少带宽与合规风险。芯片与模型的议价权被重估：旗舰不必降价，但溢价难再高筑。真正的赢家，会把AI当运营系统而非功能点——持续评测、数据飞轮、记忆工程与安全治理内嵌，单位价值/千Token长期领先。

AI若有完美记忆，是福是祸？

若AI真的拥有“完美记忆”，第一反应是福：它能把百万级上下文装进口袋，跨天跨周不丢线索，读完整仓代码与合同、连续跟踪患者用药与副作用，像资深助手那样稳定可靠。实证也在靠拢——长记忆系统在长期检索测试里接近满分，任务成功率随“记忆—检索—纠错”闭环显著上扬，智能体由此具备更稳的长期规划力。可另一面更像放大镜：一旦把错当成对，错误会被“牢牢记住”；一旦把私密当做可用数据，隐私就会被“永久可检索”。完美记忆天然放大偏见沉积、检索投毒、成员推断与模型反演风险，也把权力不对称推到极致——谁控制记忆，谁就能重写现实的“既往事实”。答案因此不在“记不记”，而在“如何记”。只有把记忆做成可控资产：默认最小化与显式同意、可审计可撤回、到期失效与分层主动遗忘，敏感数据端侧加密与联邦汇总，并用任务成败而非堆量来奖励检索，完美记忆才是福；否则，它就是效率的外衣下，监控与误导的加速器。

如何与“高智商马大哈”AI共事？

把它当“聪明但粗心的实习生”：从不直接信任结论，只信证据。先立规矩——先判“可答/不可答”，不可答就拒答；事实类输出必须给出处，且只准引用你提供的材料（RAG）中的片段；数值题“先算后说”，保留中间步骤。复杂任务走“策划-执行”：用更强模型做分解与验收，用便宜模型执行；难题用小规模自一致性（3-5次采样多数票），再让验证器把关。脚手架要硬：强制JSON/函数调用Schema与参数静态校验；工具幂等、超时与指数退避重试；结果自动验收（正则/单元测试/静态分析/约束求解）。全程可观测，盯住三件事：无依据断言占比、外部证据覆盖率、重试后成功率；设token/时间预算与停止条件，防“跑飞”。任务分层调度：能脚本就脚本，表单/改写用小模型，开放决策才上大模型；超长上下文只投喂“证据窗”，把关KV与成本。

新知 - 大圆镜｜不追顶尖的DeepSeek V4，正在补AI的课

对抗知识焦虑，从看懂这条开始

App 下载

把100万token装进口袋的魔法

你可以把大模型的上下文窗口想象成电脑的内存——内存越大，能同时处理的文件就越多。过去的大模型最多只能装下12.8万token的内容，要是给它一本百万字的小说，它读到后半段就会忘了开头。 DeepSeek V4解决这个问题的核心，是一套叫DSA的稀疏注意力机制。你可以把它理解成一个聪明的秘书：面对堆积如山的文件，它不会逐字逐句读完全部，而是先快速扫过所有内容，用「闪电索引器」挑出最关键的部分，再集中精力处理这些重点。但真实的机制比这更精确：它先对所有token做维度压缩，再用自研的稀疏算法只保留和当前任务相关的信息，把注意力计算的复杂度从平方级降到了近线性。数据显示，在100万token的上下文下，它的内存占用只有传统模型的1%，推理算力仅为上一代的27%。

这不是炫技，而是解决了真实世界的痛点——比如律师可以用它一次性分析上百份合同，程序员能让它直接读懂整个代码库，科研人员不用再把论文拆成几段喂给模型。

从「练单个专家」到「融百家之长」

如果说上下文窗口是模型的「内存」，那训练策略就是模型的「学习方法」。DeepSeek V4这次换了一套叫On-Policy Distillation（OPD）的后训练路径——简单说，就是先让模型分别学透各个领域的技能，再把这些技能融合成一个全能选手。过去的训练方法更像「题海战术」：把所有数据混在一起喂给模型，让它自己慢慢摸索。但OPD是「分科培优」：先训练出擅长编程的「代码专家」、擅长推理的「逻辑专家」、擅长写作的「文案专家」，再用蒸馏技术把这些专家的能力提炼出来，融合进同一个模型里。

这种方法的好处是精准——模型不会再出现「编程厉害但写文章啰嗦」的偏科问题。实测数据显示，它在编程基准测试HumanEval上拿到了76.8%的得分，能直接生成可运行的3D魔方模拟代码，还能根据一篇文章自动生成排版精美的PPT。当然它也有局限：在创造性写作上，它偶尔会生硬地拽出技术术语，流畅度不如GPT-5；Agent多步任务的稳定性也还比不上顶尖闭源模型，处理复杂任务时偶尔会「卡壳」。

不追顶尖的「补课生」，补的是什么？

DeepSeek V4最特别的地方，是它的「补课」定位——它不追求一时的惊艳，而是盯着行业的短板补。第一个短板是「国产芯片适配」。过去国内大模型几乎全靠英伟达GPU训练，一旦供应链出问题，整个行业都会停摆。DeepSeek V4首次全面适配了华为昇腾系列芯片，训练和推理都能在国产硬件上完成。这不是简单的兼容，而是从模型架构层面做了优化，比如调整了参数分布和计算逻辑，让国产芯片的算力能充分发挥。第二个短板是「开源生态的空白」。顶尖闭源模型虽然好用，但价格贵、不能本地化部署，中小企业根本用不起。DeepSeek V4不仅开源，还推出了两个版本：1.6万亿参数的Pro版负责复杂任务，2840亿参数的Flash版主打低成本快速响应，后者的API价格比上一代降了50%。第三个短板是「长文本推理的实用性」。之前很多模型号称支持长上下文，但实际用起来要么速度慢，要么会丢失信息。DeepSeek V4把100万token做成了标配，而且真的能在这个长度下保持推理的准确性——有软件工程公司用它分析85万token的代码库，成功定位了跨文件的内存泄漏问题，准确率达97%。

当大家都在盯着「下一个GPT」的时候，DeepSeek V4选择做「能落地的大模型」。它没有炫技式的突破，却把那些被忽略的细节做扎实：让长上下文从「实验室指标」变成「实用功能」，让国产芯片从「备选方案」变成「核心支撑」，让开源模型从「玩具」变成「企业能用的工具」。斯坦福2026年的AI指数报告显示，中美顶尖模型的性能差距已经几乎持平，而中国在AI专利、工业应用上的优势正在扩大。这种优势不是靠一两个「爆款」堆出来的，而是靠无数像DeepSeek V4这样的「补课生」，把每一块短板都补上，把每一步都走稳。 真正的技术进步，从来都是慢工出细活。

把100万token装进口袋的魔法

从「练单个专家」到「融百家之长」

不追顶尖的「补课生」，补的是什么？

评论