光解决了距离，AI的下一个瓶颈会在哪？

光把“距离”抹平后，刹车踏板会移到“内存与I/O”。HBM容量/带宽增速赶不上模型与激活膨胀，参数、优化器与检查点把压力推向存储：1万亿参数全量一次≈2TB，含优化器达8–12TB，常规容错就逼近PB级吞吐。CXL/NVLink内存池换来容量却付出更高延迟，算法侧必须更激进地做激活压缩、冗余削减与通信规约。第二个瓶颈是供电与散热的工程边界。把72扩到576/1152并联，一个域就逼近兆瓦级，机房需>150kW/柜的液冷与高温水回路，配电/冷却改造周期18–36个月常慢于芯片迭代。即便CPO降低互联能耗，系统级PUE与水力成本才是TCO主导，电网接入与水资源将成为选址的硬约束。最后是制造与可靠性叠加的软件可用性。HBM与CoWoS产能、CPO对准良率与外置激光寿命都会限制放量；万卡作业中任何链路的尾延迟与瞬断都会拖慢整步，需要更强的容错训练、拓扑感知调度与拥塞控制。光解决“能连多远”，而“能稳、能供、能装、能用”将决定下一程的上限。

AI用上光纤，是在模拟大脑吗？

不是。AI把铜换成光，是在解带宽、距离与能耗的工程瓶颈，让成百上千颗GPU像“一块大加速器”协同；计算范式仍是密集矩阵运算与反向传播，并非大脑那种稀疏、事件驱动的脉冲放电。对比之下，人脑约20瓦、信号几十米/秒；数据中心机柜动辄百千瓦、链路达Tb/s级，用光只是更高效搬运比特，不是“学脑”。若硬要找相似，只在互连层的分工：短距用铜、远距用光，有点像皮层的局部密连与白质长束各司其职。但这只是拓扑与能效策略的巧合。真正“模拟大脑”的，是神经形态计算与脉冲神经网络（如Loihi、TrueNorth等）；光互连则是把通信开销从训练中剥离、提高可扩展性的工业工程。

被光取代的铜缆，为何还悄悄热销？

因为“被取代”的只是长距与跨机柜的那一段。机柜内与相邻机柜的短中距链路里，铜缆在成本、功耗与可靠性仍是三连胜：800G AEC 2米只要约400–450美元、5米约550美元，功耗远低于光学，且几乎零链路抖动，适配高密度高热环境。结果是2026年高速铜缆市场约50亿美元，其中DAC占50–60%，AEC占35–40%，需求并未降温，反而结构升级。更现实的是时间和供应链。CPO仍在早期，2026年渗透不足1%，激光器产能吃紧还被头部玩家提前锁走。运营商为压电、控故障、抢交付，只能先把“能用铜的地方都用铜”。NVL576等系统第一层仍保留铜，单机柜动辄上千米线缆；每台GPU服务器的有源铜缆从1根涨到多根。Credo拿下约88% AEC份额，9米800G AEC已能跨多机架，铜在可达距离上继续蚕食空白地带。展望到2027年前，光学标准（LPO/NPO/CPO）仍在定型，铜缆却在CPC、主动背板、224G/通道与1.6T AEC上迭代提效。等光学全面铺开已是2028年之后，铜早把“短中距甜蜜区”坐稳——不是被淘汰，而是被精准分工，量能还在悄悄走高。

新知 - 大圆镜｜铜缆锁死AI算力上限，光互连打开千GPU时代

大圆镜

内容由AI生成，思考得你完成

App Store 下载 Android 下载

铜缆的黄金时代，止步于72颗GPU

你可以把AI集群的互连系统想象成城市的道路网：GPU是办公楼，数据是车流，而铜缆就是连接它们的街道。在NVL72机柜里，5000多根铜缆像毛细血管一样缠满整个机架，总长超过3.2公里，占了机柜1.36吨自重的大头。之所以要把9块NVSwitch交换机死死卡在机柜正中央，是因为铜缆里的电信号在1.8TB/s的带宽下，跑不了1米就会开始衰减——就像车流在窄巷里挤得寸步难行，必须让每个GPU到交换机的距离都最短。

铜缆曾是无可争议的最优解：它便宜，无源器件几乎不耗电，还不像光模块那样有激光器老化的问题，在百万级链路的集群里故障率极低。NVL72靠这套铜缆方案，把72颗GPU拧成了一个超级计算单元，推理速度比上一代快30倍。但问题也摆在眼前：铜缆的传输距离就像城市道路的长度上限，再宽的巷子也只能在小区里打转，连不成跨区的高架。当AI模型需要几千颗GPU协同计算时，铜缆就成了把算力困在笼子里的那把锁。

CPO：把光引擎焊在芯片上的革命

光互连不是新鲜事，数据中心的机柜之间早就用光纤传数据了，但要把光用到GPU内部的「小区道路」上，难度堪比把高铁轨道铺进胡同。传统的可插拔光模块就像带轮子的高铁车厢，不仅占地方，单个模块功耗10-15瓦，72颗GPU装下来要多耗20千瓦——对已经吃120千瓦电的机柜来说，这无疑是雪上加霜。

改变局面的是共封装光学（CPO）——简单说就是把光引擎直接焊在交换芯片的封装里，省掉了光模块的外壳、连接器和大部分信号处理电路，就像把高铁轨道直接接到了办公楼的地下室。电信号不用再走几十厘米的PCB线路，直接在毫米级的距离里转换成光信号，功耗一下子降了65%-73%，体积也缩小了一大半。

英伟达在2025年先把CPO用在了机柜间的「高架路」上，验证了技术可行性，现在要把它铺进GPU集群的「内部道路」。到2028年的Feynman系统，他们甚至计划把CPO直接集成到GPU封装里，让几千颗GPU之间的光信号传输像在同一个房间里递东西一样快。

60亿美元押注，抢的是算力生态的命门

英伟达砸的60亿美元，其实是在抢光互连供应链的船票。CPO的核心瓶颈是激光器——就像高铁的发动机，全球能稳定供货的厂商屈指可数。英伟达给Coherent和Lumentum各投20亿美元，直接锁定了未来几年的激光器产能，相当于把高铁发动机的生产线包了下来；给Marvell的20亿美元，则是要拿下硅光子技术，把光信号的「铁轨」做得更宽更稳。

这套路像极了他们之前锁HBM内存和CoWoS封装的操作：在技术拐点到来前卡住上游，让竞争对手慢半拍。当AMD、Intel的开放互连标准UALink要到2027年才能规模部署时，英伟达的光互连集群已经能跑1152颗GPU了。更关键的是，光互连不仅是把GPU数量变多，更是让AI模型能真正实现「全局思考」——几千颗GPU像一个大脑的神经元那样协同，而不是各自为战的小作坊。

当然，铜缆并没有被淘汰。就像城市里依然需要小巷子，机柜内部的短距离连接，铜缆还是最经济可靠的选择。英伟达的路线图是「铜光混合」：短距离用铜，长距离用光，把两者的优势捏到一起。

当我们谈论AI算力的增长时，往往只盯着GPU的芯片架构，却忽略了连接它们的「神经纤维」。铜缆给AI带来了第一个黄金时代，但物理定律的天花板，终究要靠更精妙的技术突破。

从72到1152，数字的背后不是简单的数量叠加，而是AI超级计算从「单栋写字楼」到「整个城市」的跃迁。光互连不是要取代铜缆，而是要给AI算力搭起更辽阔的骨架——让万亿参数模型不再是实验室里的奢侈品，让通用AI的梦想能走得更远。

算力的边界，终究由连接定义。

铜缆的黄金时代，止步于72颗GPU

CPO：把光引擎焊在芯片上的革命

60亿美元押注，抢的是算力生态的命门

评论