对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
Feynman系列|Rubin系列|GTC大会|黄仁勋|英伟达|半导体技术|AI算力|前沿科技|人工智能
如果说人工智能是一座正在以惊人速度崛起的超级都市,那么算力就是这座城市的钢筋水泥与电力网络。如今,这座城市的扩张正逼近物理极限,地基(半导体物理)的承载力、能源(电力)的供应、交通(数据带宽)的拥堵,都亮起了红灯。就在此时,英伟达CEO黄仁勋投下了一颗重磅炸弹:他将在GTC 2026大会上,揭晓“世界前所未见”的全新芯片。
这不仅仅是一次产品发布预告,更像是一场新基建竞赛的开战檄文。黄仁勋坦言,新品研发“所有技术都已逼近极限”,这句悲观的陈述背后,却预示着一场从平面到立体的范式革命。业界普遍猜测,无论是Rubin系列的迭代,还是被称为“革命性”的下一代Feynman系列,其核心突破都将不再局限于二维平面的晶体管缩放游戏。
长期以来,芯片性能的提升遵循着“摩尔定律”,即在有限的硅片上塞入更多、更小的晶体管。但这就像在一片土地上无限制地增加平房,很快就会遇到面积和交通的瓶颈。AI芯片如今面临的正是这样的“功耗墙”与“内存墙”:
解决方案是什么?向上走,建造“算力摩天楼”。这就是先进封装技术(如台积电的CoWoS、英特尔的Foveros)的本质。通过2.5D乃至3D堆叠,将不同的计算和存储芯片像楼层一样垂直整合在一起,大幅缩短数据传输距离,提高互联密度。这不仅解决了交通拥堵(带宽瓶颈),也让空间利用率指数级提升。长电科技等中国厂商也已凭借XDFOI等技术切入这一赛道,应用于海思昇腾等国产芯片,这场围绕封装技术的立体战争已然打响。

在“算力摩天楼”的架构中,电梯的速度和容量至关重要,这便是高带宽内存(HBM)的角色。从HBM3到即将成为Rubin架构核心的HBM4,其目标就是为摩天楼提供超高速的垂直交通系统,带宽提升至每秒2TB以上,相当于一秒传输数十部4K电影。英伟达与SK海力士等存储巨头正探索将HBM4直接堆叠在GPU之上,打造半导体史上最复杂的芯片之一。
然而,更激进的创新者认为,连“坐电梯”都太慢了。他们希望直接在“房间”(存储单元)里办公,这就是“存算一体”(Processing-in-Memory)的理念。通过将计算单元嵌入存储阵列,彻底消除数据搬运的能耗和延迟。虽然这项技术仍在演进,但英伟达Feynman系列芯片传闻将探索以SRAM为核心的广泛集成,正是向这一终极目标迈出的重要一步。一旦成熟,AI芯片的能效比将迎来数量级的飞跃。
摩天楼越高,能源消耗和散热压力就越大。据预测,到2028年,仅美国数据中心的用电量就可能占全美总用电量的12%。黄仁勋的“五层蛋糕”理论中,最底层的能源层,正成为制约AI发展的最终瓶颈。英伟达最新的GB200服务器单柜功耗高达130kW,传统风冷已是杯水车薪。
液冷,正从“可选项”变为“必选项”。无论是直接贴合芯片的“冷板式液冷”,还是将整个服务器浸泡其中的“浸没式液冷”,其散热效率远超空气。中国明确要求新建大型数据中心PUE(电能利用效率)低于1.15,这几乎强制了液冷方案的普及。这场竞赛不仅是芯片设计之争,更是热力学、流体力学和电力工程的综合国力比拼。
黄仁勋的宣言,也映照出全球AI基础设施竞赛的白热化。美国凭借英伟达等巨头在技术上限上持续拉高,试图构建闭源的技术壁垒。而中国则依托庞大的应用场景和强大的工程能力,走上了一条“开源权重+快速产业扩散”的道路。华为昇腾、海光等国产AI芯片的出货量已突破万卡级别,并与液冷等基础设施方案深度绑定,加速构建自主可控的算力底座。
最终,这场关乎未来的竞赛,已不再是单一芯片的性能比拼。它是一场围绕芯片架构、先进封装、存储技术、散热方案乃至能源供给的“立体战争”。黄仁勋即将揭晓的“极限”芯片,将是这场战争走向新阶段的标志。它告诉我们,未来AI的领导者,不仅要懂得计算的逻辑,更要掌握能量与空间的物理法则。