对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
线性方程组求解|光学计算|激光处理单元|LightSolver团队|先进材料|前沿科技
当工程师在设计飞机机翼的气流模型,或者材料科学家模拟合金的应力分布时,他们都在做同一件事——求解动辄包含几十万个未知数的巨型线性方程组。传统GPU处理这类问题,可能要花上百毫秒,甚至有些复杂矩阵根本算不出结果。但以色列LightSolver团队的一台激光装置,却能在几毫秒内给出答案。这不是科幻电影里的道具,而是基于激光处理单元(LPU)的光学计算方案——它不用数字迭代,而是让光自己“演化”出方程的解。
你可以把传统数字计算机解方程的过程,想象成一群人排队挨个试钥匙:先猜一个解,检查对不对,不对就换一把,反复迭代直到打开锁。而LPU的思路完全不同——它把整个钥匙孔的形状直接刻在激光的传播路径上,让光自己找到最适配的“钥匙”。

LPU的核心是一个简并腔环形激光器,里面有数十到上百束独立的激光模式在光路中循环。这些激光的相位就像一群小磁针,当研究人员把方程组的系数矩阵编码成激光之间的耦合强度后,开启激光器,这些“小磁针”会顺着物理规律自动排列到能量最低的稳定状态——而这个状态的相位分布,正好就是方程组的解。

传统计算的每一步迭代都要把数据从内存搬到计算单元,这就是困扰高性能计算几十年的“内存墙”。但LPU里的激光既是计算介质也是存储介质,光的演化过程本身就是计算,完全绕开了数据搬运的瓶颈。
在针对热传导、材料科学、结构力学三类稀疏矩阵的测试中,LPU模拟器的求解速度比NVIDIA RTX 3090 GPU上的主流算法快了几十到上百倍。尤其是在24万维度的BenElechi1矩阵上,部分GPU算法根本无法收敛,而LPU只用了几毫秒就给出了结果。
但这份亮眼的成绩有个前提:LPU目前的求解精度只能达到1e-5,相当于把1米的误差控制在1厘米以内,这对要求微米级精度的航空航天设计可能不够用。而且它的优势只体现在稀疏多带状矩阵这类特定问题上,面对不规则的非结构矩阵,效率会大打折扣。
更重要的是,目前所有测试结果都来自软件模拟器,真实的光学硬件还面临着诸多挑战:光学元件的对准精度要求极高,温度、振动的微小变化都会干扰激光相位;要处理百万级变量的超大规模问题,单个LPU的激光阵列规模还远远不够。
LPU的研发团队并没有打算让它完全取代GPU,而是提出了更务实的路线:做混合光-数字系统里的专用加速器。就像Nvidia在Vera Rubin平台里让Groq LPU负责低延迟的令牌生成,GPU负责大规模批处理一样,未来的高性能计算系统里,LPU可以承担最耗时的核心矩阵运算,数字处理器则负责高精度的预处理、残差评估等复杂逻辑。
这种分工刚好避开了LPU的短板:数字系统的高精度可以弥补光计算的精度不足,而LPU的低延迟又能突破数字计算的内存墙。LightSolver已经和Ansys等工程软件公司展开合作,计划在2027年推出支持10万个变量的硬件,2029年实现百万级变量规模。
更值得关注的是,LPU代表的是一种全新的计算范式——从“用数字模拟物理”转向“用物理模拟数学”。这种思路不止适用于光计算,未来我们可能会看到更多基于量子、流体甚至生物系统的物理计算设备,它们将和数字计算一起,构成后摩尔时代的计算生态。
当摩尔定律的脚步逐渐放缓,我们一直在寻找突破性能瓶颈的新路径——从3D封装到存算一体,从量子计算到神经形态芯片。LPU的出现,让我们看到了另一种可能:不用在数字世界里苦苦模拟物理,而是直接让物理系统成为我们的计算工具。
用物理演化替代数字迭代,是后摩尔时代的破局之道。或许在未来的超级计算机里,我们会看到激光腔的光芒和芯片的灯光交相辉映——光负责用最快的速度找到方向,数字负责用最高的精度抵达终点。而这,才是高性能计算真正的未来。