对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
TPU资源|算力饥荒|DeepMind|GPU训练卡|英伟达|AI算力|人工智能
2026年5月的硅谷,AI圈最荒诞的一幕正在上演:当年帮英伟达押注AI赛道的功臣Bryan Catanzaro,如今在自家公司申请GPU训练卡,得到的回复是“那些卡已经卖掉了”。而谷歌DeepMind的研究员Andrew Dai,因为项目不能直接服务旗舰模型Gemini,连内部TPU资源都拿不到,最终选择离职创业——他靠3.35亿美元融资买到的算力,和谷歌当初挽留他开出的条件几乎相当。这不再是巨头抢算力的军备竞赛,而是一场从实验室到创业圈的全面“算力饥荒”。为什么连造铲子的人都没铲子了?这背后藏着一个比产能短缺更致命的陷阱。
你可以把AI算力市场想象成一个拥堵的停车场:车位明明有不少,但一半被人占着却不开车,剩下的空位被几百辆车围着抢。Cast AI的报告显示,大企业GPU集群的平均利用率只有5%——相当于100个车位里,真正在使用的只有5个。马斯克的Colossus算力中心,模型算力利用率也仅11%。

这不是企业不知道浪费,而是不敢放手。当云销售打电话说“只剩36张卡,签一年长约,后面还有五家等着”时,没人敢说“我不需要”。先抢下来再说,哪怕闲置也绝不释放——因为交出去的卡,可能再也拿不回来了。这种“错失恐惧症”制造了囤积,囤积又加剧了短缺,短缺再放大恐慌,形成一个闭环的死循环。
更关键的是,算力的流动性彻底枯竭了:它锁在企业的长约里,困在云厂商的容量池里,但就是出现在普通开发者今晚能点开的购买页面上。英伟达高管Robert Ober一针见血:“算力短缺不是因为没有GPU,而是因为它们被长期锁定在合同里,无法快速释放。”
你可能会奇怪:新一代B200 GPU性能更强,为什么H100、H200的租赁价格反而更高?半年里H100的租金涨了40%,现货价格是两年前的两倍,甚至比B200还贵。
答案藏在“确定性”里。对于推理服务、代码Agent、小模型复现这些海量需求来说,最先进的芯片从来不是首选。做工程的人都懂:真正值钱的是“好用”——H100的生态足够成熟,别人的基准测试用它,调参经验有人踩过坑,跑起来不出错;而B200再强,也需要时间适配框架、调试集群,这些都是看不见的成本。
就像你不会为了最新款的烤箱,放弃用了十年的旧锅——哪怕旧锅不如新烤箱先进,但它能精准烤出你要的温度。现在的算力市场,不是按“谁更新”定价,而是按“谁能马上用、不出错”定价。旧卡本该退场,却因为“确定性”成了刚需,进一步挤压了新卡的流通空间。
AI民主化的口号喊了很久,但算力正在把这个理想撕成两半。
开源模型确实降低了技术门槛——你可以免费下载Meta的LLaMA权重,但要复现一次实验,可能需要8×H100跑上几天。Andrew Ng曾说“AI是新的电力”,但现在看来,这更像是“只有少数人能用上的电力”。AI大神Andrej Karpathy吐槽,录制教学视频时才发现,让学员“启动一台8×H100服务器”,就已经把90%的人挡在了门外。
大厂里,非盈利的基础研究项目在和付费客户抢资源;围墙外,独立开发者连租卡的资格都没有。华盛顿大学教授Oren Etzioni说:“在谷歌内部,每一块TPU的背后都有三位竞争者。”那些不能直接带来收入的项目,那些想探索新方向的研究员,正在被算力筛选出去——要么转向能赚钱的项目,要么离职创业。
这种分化正在重塑创新生态:头部企业拿着算力迭代旗舰模型,创业公司靠融资买算力试错,而普通开发者只能在“用本地Mac硬跑小模型”的边缘挣扎。
当我们谈论AI算力短缺时,我们谈论的从来不是芯片不够用,而是资源分配的失衡——是囤积的闲置算力,是流动性的枯竭,是“确定性”压倒“创新”的现实。

算力正在从基础设施,变成一种权力:它决定谁能做研究,谁能搞创新,谁能在AI赛道上拿到入场券。而打破这个死循环的关键,或许不是造更多芯片,而是让已有的芯片流动起来——让闲置的算力进入市场,让普通开发者能拿到稳定的资源,让探索未知的项目不必为了生存向商业妥协。
算力的本质,应该是创新的燃料,而非筛选的门槛。