冰火难容，芯片里的光与电咋同居？

诀窍就一句话——电短光长。把光引擎搬到交换/计算芯片身边，用2.5D中介层或高密度扇出把硅光PIC、驱动/TIA与低功耗SerDes并排共封，电信号只走毫米级短链路，然后交给光纤跑米到公里级的长距离。为减少热源，常把激光器做成外置光源，通过光纤引入；为提高装配密度，更多采用光栅耦合，容差更友好。量化到工程：对准精度需约±0.5微米、插入损耗<1 dB，链路能耗可压到3–5 pJ/bit，1.6T正迈向3.2T，端到端新增延迟只有2–5 ns。难点在“冰火同居”的热与材料冲突。数百瓦级芯片热点可上百摄氏度，而激光/微环对温度极敏，需将漂移压在±5℃内，于是设计上做分区散热、热隔离沟槽、均热板甚至微流道，把热流从光敏区“引开”；器件层面用“无温漂”波导与闭环微热调谐对冲约0.1 nm/℃的微环漂移。不同材料热胀冷缩不一，则靠低模量底填、应力释放台阶与CTE匹配基板避免脆裂。最后一道关是量产测试：将光学仪器并入ATE，自动耦合替代人工，良率卡点在光纤耦合与系统级热/光学老化，但最新大规模运行数据已把MTBF推到百万小时量级，说明“冰火”可以和平共处。

AI的“电费焦虑”，靠光就能治好吗？

能缓解，治不好“一针见效”。把“电短光长”的CPO/LPO上到位，数据搬运的能耗确实能腰斩：典型可插拔链路约10–15 pJ/bit，CPO目标3–5 pJ/bit，不少方案瞄准50%以上节能；LPO单模块也能降20–25%功耗。可光不免费：激光器本身耗电且怕热，贴近高功耗ASIC会拉高散热与良率成本；早期CPO还要为封装复杂度和可维护性付溢价，网络账单下降，集群总电费通常只小幅下探。要真止住电费出血，关键是让“用光”改造系统形态，而非只换收发器。当光互连支撑更高基数交换并压平网络，从三层减到两层，设备与能耗同步掉头，测算显示集群总成本可降至约7%，否则仅约3%。节奏也别心急：2026–2028仍是验证爬坡期，LPO/NPO先落地；CPO要规模化，得靠外置激光、液冷、标准化与良率提升。更远处，Micro LED与3D光电共封把pJ/bit推向亚皮焦。结论：光是解药的一半，另一半在架构与工程。

芯片高速路绕开旧赛道，谁将被超车？

最先被超车的，是机架内的铜互连阵营——DAC/AEC、厚背板PCB、高速连接器以及配套的retimer/redriver。224G单通道把铜线有效距离压到约2米，到了800G/1.6T再靠均衡与放大只会让功耗和成本陡增。CPO把光电转换贴到芯片旁，电程毫米级、链路损耗可控在约1 dB内，能耗下探至约3–5 pJ/bit，端口密度成倍提升，直接挤压铜系在高端场景的生存空间。第二个被慢慢甩开的，是“重DSP”的可插拔光模块及其上游DSP/CDR生态。LPO已把DSP功能收回设备侧，CPO更进一步把模块并入封装，价值中枢从壳体与面板接口迁移到硅光PIC、InP激光、FAU耦合与先进封装平台。缺乏硅光与异构3D封装、微米级对准与光学测试能力的传统OSAT和面板连接器体系会被边缘化；而具备SiPho/COUPE产线、UHP激光与高效散热（均热板、微流道）的厂商，将在Tbps级端口与机架内互联处完成超车。短期并存，真正的“变道提速”将发生在机架内与更高端口速率上。

新知 - 大圆镜｜数据中心省电七成的秘密：把光芯片焊在CPU旁

Q: AI的“电费焦虑”，靠光就能治好吗？

能缓解，治不好“一针见效”。把“电短光长”的CPO/LPO上到位，数据搬运的能耗确实能腰斩：典型可插拔链路约10–15 pJ/bit，CPO目标3–5 pJ/bit，不少方案瞄准50%以上节能；LPO单模块也能降20–25%功耗。可光不免费：激光器本身耗电且怕热，贴近高功耗ASIC会拉高散热与良率成本；早期CPO还要为封装复杂度和可维护性付溢价，网络账单下降，集群总电费通常只小幅下探。 要真止住电费出血，关键是让“用光”改造系统形态，而非只换收发器。当光互连支撑更高基数交换并压平网络，从三层减到两层，设备与能耗同步掉头，测算显示集群总成本可降至约7%，否则仅约3%。节奏也别心急：2026–2028仍是验证爬坡期，LPO/NPO先落地；CPO要规模化，得靠外置激光、液冷、标准化与良率提升。更远处，Micro LED与3D光电共封把pJ/bit推向亚皮焦。结论：光是解药的一半，另一半在架构与工程。

Q: 芯片高速路绕开旧赛道，谁将被超车？

最先被超车的，是机架内的铜互连阵营——DAC/AEC、厚背板PCB、高速连接器以及配套的retimer/redriver。224G单通道把铜线有效距离压到约2米，到了800G/1.6T再靠均衡与放大只会让功耗和成本陡增。CPO把光电转换贴到芯片旁，电程毫米级、链路损耗可控在约1 dB内，能耗下探至约3–5 pJ/bit，端口密度成倍提升，直接挤压铜系在高端场景的生存空间。 第二个被慢慢甩开的，是“重DSP”的可插拔光模块及其上游DSP/CDR生态。LPO已把DSP功能收回设备侧，CPO更进一步把模块并入封装，价值中枢从壳体与面板接口迁移到硅光PIC、InP激光、FAU耦合与先进封装平台。缺乏硅光与异构3D封装、微米级对准与光学测试能力的传统OSAT和面板连接器体系会被边缘化；而具备SiPho/COUPE产线、UHP激光与高效散热（均热板、微流道）的厂商，将在Tbps级端口与机架内互联处完成超车。短期并存，真正的“变道提速”将发生在机架内与更高端口速率上。

对抗知识焦虑，从看懂这条开始

App 下载

当你刷着AI生成的视频、用大模型写方案时，千里之外的某座仓库里，数万片GPU正在以每秒万亿次的速度交换数据——它们的耗电量，可能比你家小区全年的用电量还高。

数据中心的电费账单正在以每年30%的速度膨胀，而传统铜线和光模块的能耗，已经摸到了物理极限：传输800G数据，一个光模块就要吃掉16瓦电，相当于3个手机同时充电。

最近，一家国产厂商交出了新的答案：把光引擎和计算芯片塞进同一个封装里，让电信号的传输距离从30厘米缩短到3毫米。测试显示，这套方案能把800G数据的传输功耗降到4瓦，直接砍掉70%。这不是实验室里的空想，样品已经通过了客户验证。但它真的能解决数据中心的能耗焦虑吗？

从“快递接力”到“楼下取件”：CPO的底层逻辑

你可以把传统数据中心的信号传输想象成一场快递接力：计算芯片（CPU/GPU）把数据交给PCB板上的铜线“快递员”，跑30厘米到光模块“中转站”，转换成光信号后再送出去——每一次接力都要损耗能量，还要靠DSP芯片“快递站长”来修正信号误差，这部分能耗占了整个传输过程的60%。

而共封装光学（CPO）技术，就是把光模块这个“中转站”直接搬到计算芯片的“楼下”。

真实的机制比这更精确：它将包含调制器、探测器的光引擎，通过2.5D封装技术和计算芯片集成在同一个基板上，电信号只需走几毫米就完成光电转换，彻底省去了长距离铜线传输的损耗，连功耗高昂的DSP芯片都能直接砍掉。

这不是简单的“凑近距离”：

电信号路径缩短90%，信号损耗从22dB降到4dB；
800G带宽的传输功耗从16瓦降到4-5瓦；
单芯片的带宽密度突破1.6T，是传统方案的3倍以上。

省电不是唯一：AI集群的“救命稻草”

更值得关注的是，CPO解决的不只是电费问题，更是AI集群的“带宽焦虑”。

训练一个千亿参数的大模型，需要上万片GPU同时工作，每一秒钟都要交换几十TB的数据。传统的铜线互连最多支持2米距离，超过这个范围，信号衰减会让整个集群的计算效率直接腰斩——就像一群人在操场上喊着传话，人越多、距离越远，错误率越高。

CPO的短距离互连打破了这个限制：

它支持跨机架的低延迟连接，让AI集群的规模可以从几千片GPU扩展到几万片；
英伟达的Quantum-X交换机采用CPO技术后，115Tb/s的交换容量能让AI训练时间缩短18%；
系统级功耗降低2%-4%，一个10万台服务器的超算中心，一年能省下近千万度电。

但这一切的前提是解决“热管理”这个棘手问题：光引擎和计算芯片挤在几平方厘米的空间里，局部温度会飙升到80℃以上，而光调制器的波长对温度变化极其敏感——哪怕只高1℃，信号误码率就会翻倍。目前的解决方案是在封装里集成超薄蒸汽室，把温度波动控制在±1℃以内，这又给制造工艺增加了新的难度。

不是“替代”是“共生”：CPO的现实边界

被忽略的关键在于，CPO不是传统光模块的“终结者”，而是一场需要全产业链配合的“系统革命”。

首先是标准化的缺失：目前不同厂商的CPO接口、调制格式各不相同，就像不同品牌的手机充电器不能通用，这让数据中心运营商不敢轻易切换方案——一旦选用某家的CPO设备，未来的扩容只能继续买同品牌的产品。

其次是维护成本的上升：传统光模块坏了可以热插拔更换，而CPO的光引擎和芯片焊在一起，一旦出现故障，只能换掉整个交换机板卡，维修成本是传统方案的3倍以上。

还有制造良率的瓶颈：CPO需要把光芯片和电芯片精确对准，误差不能超过1微米，相当于头发丝直径的1/60，目前良率只有60%-70%，这直接拉高了产品成本——虽然光引擎本身的成本是传统模块的一半，但算上封装和测试成本，终端价格只比传统方案低10%左右。

也难怪有些运营商会选择“折中方案”：用线性可插拔光模块（LPO）先过渡，它去掉了DSP芯片，功耗比传统模块低40%，还保留了热插拔的便利性，适合中等规模的AI推理集群。

当我们为CPO的70%节能效率欢呼时，别忘了它的本质：不是某一项技术的突破，而是数据中心从“以计算为中心”转向“以互连为中心”的开始。

未来十年，AI模型的参数会从千亿级跃进到万亿级，数据中心的能耗会再翻3倍，而CPO只是第一步——我们还需要更高效的激光器、更智能的热管理系统、更开放的行业标准。

“算力的边界，终究是互连的边界。”这句话正在被越来越多的人验证：当计算芯片的性能提升遇到瓶颈时，如何让数据跑得更快、更省，才是下一场技术革命的核心。

从“快递接力”到“楼下取件”：CPO的底层逻辑

省电不是唯一：AI集群的“救命稻草”

不是“替代”是“共生”：CPO的现实边界

评论