对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
智能设备|功耗墙|冯·诺依曼架构|存算一体|AI芯片|半导体技术|前沿科技
当你在手机上体验AI实时生成一幅画作,或是让智能音箱进行多轮复杂对话时,你或许会感觉到设备背板那令人不安的温升。这场AI驱动的智能革命,正伴随着一场悄无声息的“高烧”。大模型呼啸而至,算力需求呈指数级暴增,但我们掌中的智能设备,却被功耗和续航的物理极限牢牢铐住。云端的AI或许无所不能,但每一次调用都意味着数据往返的延迟、隐私泄露的风险以及高昂的能源账单。我们渴望一个能随时随地、即时响应、且无需为电量焦虑的AI时代。然而,一个根本性的障碍横亘在前:支撑了现代计算70余年的冯·诺依曼架构,正面临其诞生以来最严峻的挑战——“功耗墙”与“存储墙”。
在传统的冯·诺依曼架构中,计算单元(CPU/GPU)与存储单元(内存)是分离的。想象一下,为了完成一次计算,数据需要像通勤者一样,在“居住区”(存储)和“办公区”(计算)之间来回奔波。这场旷日持久的“数据通勤”不仅耗费了大量时间,更惊人的是,它消耗了整个计算任务中60%到90%的无用功耗。这便是“存储墙”与“功耗墙”的由来,它们像两座大山,阻碍着AI算力与能效的进一步提升。当AI计算对数据带宽的需求飙升至PB/s级别时,传统内存几十GB/s的速度显得杯水车薪。正是在这一背景下,一场颠覆性的架构革命——存算一体(Computing-in-Memory),正从学术界的构想,加速走向产业现实。2024年,随着三星与SK海力士联手推动LPDDR6-PIM技术标准化,以及多款存算一体AI芯片的相继出货,这项旨在彻底推倒“高墙”的技术,正迎来其黄金时代。市场预测,2025年全球存算一体芯片市场规模将突破120亿美元,中国将占据其中30%的份额,一个全新的千亿级赛道已然开启。

在这条新兴赛道上,知存科技(Witmem)是起步最早、坚持最久的探索者之一。它的故事始于创始人王绍迪博士在2014年一次不经意的思考。彼时,AI的浪潮初起,正在攻读博士的王绍迪敏锐地意识到,未来AI模型越强大,对存储器的依赖将远超CPU和GPU。“为什么不能让存储器自己来完成计算呢?”这个想法在他心中扎下了根。2017年,王绍迪博士毕业后毅然回国创业,成立了知存科技,一头扎进了当时还略显冷僻的存算一体领域。八年磨一剑。如今,知存科技不仅实现了存算一体芯片的规模化量产,其产品已成功应用于超过二十款消费电子产品中。2025年9月,公司更是入选了《麻省理工科技评论》年度“50家聪明公司”榜单,其上榜理由直指核心:“突破传统芯片存储与计算分离的架构,在能效、计算并行度、功耗等多个维度获得显著提升”。
存算一体究竟是如何施展“魔法”的?王绍迪用一个生动的比喻揭示了其奥秘。传统的计算方式,就像要从一个容纳数万人的体育场里找出两个人,把他们带到遥远的办公室,只为问一句“吃饭了吗?”,然后再把他们送回原位。整个过程中,找人、走路的代价远高于问话本身。而存算一体则完全不同。AI计算的核心,90%是简单且规整的乘法和加法运算。存算一体的逻辑是,如果这两个人恰好是邻居,我们根本无需让他们“出远门”,只需让他们在各自的单元楼里,打开门互相问候一声,就能完成任务。数据不再需要长途跋涉,而是在存储单元内部“就地解决”,这就是存算一体的精髓。这种架构上的革新带来了惊人的效率飞跃。如果说CPU是一次处理一个数据点,GPU凭借其并行架构能一次处理十万个点,那么存算一体则能将并行度提升至惊人的十亿个点,实现了又一次数量级的跨越。它并非简单地把计算和存储靠得更近(近存计算),而是让存储单元本身就化身为成千上万个微型计算器(存内计算),从根本上消除了数据通勤。

技术的价值最终要通过应用来体现。存算一体的第一个规模化落地场景,出人意料地选择了我们日常佩戴的TWS耳机。耳机的工作功耗通常只有几毫瓦,要在如此严苛的限制下运行复杂的AI算法,对传统芯片而言几乎是不可能的任务。但知存科技的芯片做到了。它能让耳机的AI算力提升50到100倍,足以在本地运行类似Transformer的大模型算法。这带来的体验是革命性的。传统的降噪技术是“减法”,识别并剔除噪音,但往往会损伤人声。而搭载了存算一体芯片的耳机则能做“生成式”降噪:它能理解你说话的内容、音色和语气,然后重新生成一段干净、清晰的人声,彻底摆脱背景噪音的干扰。如果说耳机只是牛刀小试,那么机器人则是存算一体技术志在必得的星辰大海。王绍迪坚信,未来的机器人若想真正具备生产力,与物理世界进行实时、流畅的交互,就必须在端侧完成绝大部分计算。云端往返的几十毫秒延迟,对于需要在一毫秒内做出反应的机械臂来说是致命的。只有当强大的AI大脑被植入机器人本体,它才能从一个听指令的木偶,进化为能够自主决策的智能体。存算一体,正是打造这颗强大、高效、低功耗端侧大脑的关键技术。

从一个颠覆性的想法到一块能量产的芯片,中间隔着巨大的工程鸿沟。将Transformer这样的复杂算法范式映射到存算一体架构中,是一个需要攻克的科学问题。而如何将一颗功耗仅2毫瓦的耳机芯片,放大1000倍,做成一颗功耗2瓦、能驱动手机乃至机器人的高性能芯片,则是一个更为艰巨的工程问题。“我们从2017年创业,到第一颗芯片在2022年实现量产,花了五年多时间。”王绍迪坦言。这背后,是无数次的电路设计、工艺定制和软件适配。与传统芯片可以依赖成熟的先进工艺不同,存算一体的性能提升并不完全依赖制程的微缩,它更需要在成熟工艺(如28纳米)的基础上,对存储器进行深度定制和优化。这相当于换了一条赛道,避开了在先进制程上与巨头的直接竞争,转而在架构创新上建立护城河。如今,随着大模型时代的到来,算法规模暴涨万倍,传统芯片在端侧已然“跑不动”,这为存算一体创造了前所未有的机遇。知存科技正全力以赴,解决从科学到工程的“最后一公里”,预计在未来几年内,推出能够赋能手机、机器人等更复杂设备的存算一体芯片。
放眼全球,这场围绕存算一体的竞赛已然白热化。三星、SK海力士等存储巨头正从存储器本身出发,将计算能力融入其中;英特尔、IBM等传统芯片豪门也在积极布局;而在中国,除了知存科技,后摩智能、亿铸科技等一批创新企业也正快速崛起,它们或聚焦自动驾驶,或专攻大算力推理,共同构成了中国在该领域的集团军优势。一个清晰的趋势是,计算的重心正在从云端向边缘和端侧迁移。正如当年GPU的出现,是为了解决CPU无法高效处理的图形渲染任务,并最终在AI时代成为算力主角一样,存算一体的出现,正是为了解决GPU也难以应对的端侧能效瓶颈。未来,当AI计算成为智能设备的主要任务时,今天我们熟知的以CPU为核心的主芯片架构,或许将被以存算一体为核心的AI主导芯片所取代。这不仅是芯片技术的演进,更是计算范式的一场深刻变革。
我们正处在一个新旧计算范式交替的黎明时分。冯·诺依曼架构的“高墙”之下,AI的潜能被功耗和带宽所束缚。存算一体技术,以其回归物理本质的巧思,为我们展示了一条挣脱束缚的道路。它所描绘的未来,是一个智能无处不在,却又让我们感觉不到其存在的“无感化”时代。你的个人助理将真正实现24小时在线,主动为你管理日程、预判需求,而你无需再为手机的续航而焦虑。机器人将更深度地融入我们的生活和生产,灵活、安全地与我们协作。这场由存算一体驱动的变革,最终将重新定义智能的边界,让AI真正成为我们生活中自然、高效、且值得信赖的伙伴。