2028内存过剩，芯片巨头会崩盘吗？

不会。就算2028出现阶段性过剩，寡头结构决定了“价格崩、公司不崩”。三星、SK海力士和美光手里有三张底牌：一是可迅速减产、延后投片，历史上几周内就能把产出拉下；二是与超大客户的多季长单与定价机制，让HBM价格下行晚于通用DRAM；三是现金与政府支持充足，2019与2023的深熊期它们都扛过且逆周期投产更先进工艺。但股价和利润会被重锤。若供给高出10–15%，历史上DRAM/NAND均价可回落30–50%，HBM往往滞后6–12个月补跌。最脆弱的不是巨头，而是二线DRAM与模组厂、渠道商，以及以NAND为主、成本曲线靠后的厂商；相反，HBM与先进封装链条仍相对抗跌。巨头通常通过拉长折旧、检修关线、提高HBM与DDR5占比、用CXL/封装方案捆绑出货来“软着陆”。要判断是否从“景气回落”滑向“过剩循环”，盯五个信号：巨头主动宣布减产或延后新线、HBM与通用DRAM价差快速收窄、大客户长单续签放缓、厂内利用率跌破80%、库存周数重回12周以上。即便这些同时出现，结论也更可能是“利润下台阶”，而不是“崩盘”。

像管理电网一样，共享AI的内存？

可以，但要分层、非均匀地共享。把HBM当“特高压就地消纳”，尽量不外送；可像电网那样调度的是主机DRAM与CXL挂载的内存池，以及NVLink域内的HBM互访（仍有阶梯差）。量级对比：HBM带宽>1TB/s、延迟~100ns；CXL(PCIe5/6 x16)仅约64–128GB/s，附加延迟~100–200ns，适合“温/冷”数据，不宜放训练热路径。要落地“内存电网”，需三件套：硬件织网（CXL 2.0/3.0内存池与交换、NVLink直连）、分层与迁移（页级/对象级预取、复制、回收）、调度与计量（GB·s计费、QoS和抢占）。遇拥塞做“削峰填谷”：缩批/梯度累积、激活检查点、MoE稀疏化、参数/优化器卸载到CXL/DDR/NVMe。风险在一致性、安全与故障域；需IDE加密、IOMMU隔离、SLA化监测。节奏上，2026–2027年CXL 3.0交换式内存机箱与机架级池化率先在推理见效，训练侧仍以本地HBM为王，等HBM4与更快互连再谈“全域共享”。

AI变“瘦”，能解决芯片荒吗？

能缓解，但解决不了。把AI“减重”最见效的是推理侧：4bit权重量化可把70B模型权重从约140GB压到约35GB；KV缓存做3bit压缩，128k上下文可从约64GB降到约10GB。再叠加稀疏/MoE与Flash/分页注意力，把“热”KV留在HBM，“冷”KV经CXL外扩到DDR，HBM容量与带宽的卡点立刻松动，同样的算力可服务更多请求，短期确实能缓解价格与交付紧张。但要“根治”芯片荒，还差火候。训练仍被HBM带宽与优化器状态锁死，精度难一路降到4bit；省下来的内存常被更长上下文与更大负载吞噬，典型的杰文斯效应。再叠加CoWoS/TSV良率和新线爬坡的物理极限，供给扩张是年级别节奏。“AI变瘦”能为行业赢来约一到两年的缓冲，但真正的拐点更可能出现在：HBM4与16层堆叠放量、CXL池化普及、以及厂商放松“供给纪律”三者同时到来之后。

新知 - 大圆镜｜AI算力卡脖子，竟卡在一块“堆叠内存”上

对抗知识焦虑，从看懂这条开始

App 下载

从“配角”到“主角”：HBM为何成AI刚需

你可以把AI模型想象成一个正在做饭的大厨，传统内存是门口的菜市场，要跑几百米才能拿到食材；而HBM就是厨房台面上的备菜区——把最常用的肉、菜、调料直接堆在伸手可及的地方，不用来回奔波。它通过3D堆叠多层DRAM芯片，用硅通孔（TSV）代替传统导线，带宽是普通DDR内存的20倍以上，功耗却能降低一半。

但真实的机制比这个类比更精密：每片HBM要经过晶圆减薄、钻孔、电镀铜、层间键合等几十道高精度工序，任何一层出现微小缺陷，整堆芯片都会报废。过去HBM只是高性能显卡的“奢侈品配件”，但Transformer架构的AI模型出现后，情况彻底变了——训练时的参数、激活值、梯度数据，推理时的KV缓存，都需要在内存和处理器之间高速穿梭，普通内存的带宽根本喂不饱AI芯片的胃口。

2025年，单颗AI处理器的HBM容量已经从80GB飙升到192GB，而OpenAI一家的Stargate项目，每月就需要近90万片晶圆的HBM产能——这几乎是全球现有产能的3倍。

蝴蝶效应：从AI巨头到你的手机

三大存储厂商三星、SK海力士、美光纷纷把产能转向HBM，一片晶圆生产HBM的资源是普通DRAM的3倍，直接挤压了消费级内存的供应。2024到2026年，DRAM价格暴涨了187%，连入门级的树莓派价格都近乎翻倍。

手机厂商最先感受到压力：小米、OPPO下调了2026年的出货目标，部分机型被迫削减内存配置；笔记本电脑厂商集体宣布涨价15%-20%，AI PC的32GB内存版本要么延迟上市，要么售价突破万元。游戏机厂商更头疼——索尼的PlayStation 6可能要推迟到2028年，任天堂的Switch 2也不得不提高售价来覆盖内存成本。

更隐蔽的变化是供应链的“配额制”：云厂商和AI巨头通过长期合同锁定了大部分HBM产能，创业公司和中小企业要么拿不到货，要么只能接受溢价。有AI创业公司创始人透露，他们为了拿到足够的HBM，不得不放弃部分利润空间，甚至接受供应商的“搭售”要求——买100片HBM，必须搭配200片普通DRAM。

破局之路：从堆产能到重构规则

面对HBM瓶颈，产业链正在从三个方向寻找出路。最直接的是扩产：SK海力士计划投资300亿美元扩建产能，美光把2026年的资本支出提升到200亿美元，但HBM的产能爬坡周期长达18-36个月，短期内无法缓解紧张。

技术创新则在尝试绕过“内存墙”：三星和SK海力士在研发混合键合技术，把芯片间的连接间距从30微米缩小到10微米以下，进一步提升带宽；Google推出TurboQuant技术，把AI推理时的KV缓存压缩6倍，减少对HBM的依赖。更激进的思路是“内存计算”——直接在HBM里集成计算单元，让数据不用跑到处理器里就能完成运算，把“备菜区”变成“小厨房”。

但这些方案都有各自的局限：混合键合的良率还不足50%，内存计算的编程模型需要彻底重构。更值得警惕的是“杰文斯悖论”——当HBM的能效提升后，AI模型的规模可能会膨胀得更快，最终反而消耗更多内存。

当我们谈论AI的未来时，总习惯把目光投向更强大的处理器、更聪明的算法，却常常忽略了像HBM这样的“隐形基石”。它就像城市的水管，平时没人注意，一旦堵塞，再豪华的摩天大楼也会停水断电。

AI的算力竞赛，最终比拼的可能不是谁能造出更快的芯片，而是谁能更高效地利用每一块内存。算力的边界，藏在内存的带宽里。当我们为下一个大模型的发布欢呼时，或许该停下来想想：那些支撑它运行的HBM，是怎么从工厂的无尘室，一步步走到数据中心的机架上的。

从“配角”到“主角”：HBM为何成AI刚需

蝴蝶效应：从AI巨头到你的手机

破局之路：从堆产能到重构规则

评论