对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
token计价|算力供需|显卡租赁|Blackwell芯片|英伟达H100|AI算力|人工智能
当你在手机上让AI写一段文案、生成一张图片时,可能不会想到,每一次交互都在推高远在数据中心里的一块显卡的租金。2026年3月,单块英伟达H100显卡的小时租金从半年前的1.7美元涨到2.35美元,涨幅近40%;更先进的Blackwell芯片,两个月内租金从2.75美元跳涨到4.08美元,涨幅48%。这不是普通的硬件涨价,而是一场席卷芯片设计、制造、租赁全产业链的算力争夺战——而每一个AI用户,都是这场战争的间接参与者。为什么一块显卡的租金能疯狂上涨?这背后藏着AI产业最核心的供需矛盾。
你可以把AI模型想象成一个超级印刷厂,token——就是AI处理的最小语言单位,比如一个字、一个词——就是印刷厂的纸张。以前AI只需要印传单,用普通纸就行;现在要印全彩画册、甚至3D立体书,不仅纸要更高级,用量还翻了几十倍。OpenClaw这类多模态模型的普及,让全球token消耗量在一年里涨了130倍,直接把印刷厂的“纸”给抢空了。
而GPU,就是印刷厂的印刷机。以前按“台”卖机器,现在变成按“小时”卖印刷时间——这就是算力租赁的本质。但租金的涨跌,早就不是由显卡的制造成本决定了:它看的是你要印的“书”有多复杂,要消耗多少“纸”,以及市面上还有多少空闲的“印刷机”。
一组更直观的数字:现在训练一个顶尖大模型,要消耗的算力相当于10万台H100显卡连跑一年;而全球能投入使用的H100,满打满算也不到百万台。当需求的增长速度是供应的10倍,租金的上涨就成了必然。

这场算力荒的传导链,从最上游的芯片制造就开始了。台积电董事长魏哲家说,AI芯片的需求已经“把所有设备都调动起来”,但供应还是紧张——他们的3nm生产线24小时连轴转,订单已经排到了2028年。英特尔CEO陈立武则直接放话:半导体行业的潜在市场规模,已经逼近1万亿美元,而AI就是最大的增长引擎。
芯片不够,租赁市场就成了“算力黄牛”的舞台。现在的租赁市场分成了三层:大型云厂商握着最核心的GPU资源,只给大客户签3年以上的长约;专业租赁商像“二房东”一样,把整批租来的显卡拆成小时段转租给中小客户;甚至有人把闲置的家用GPU也挂到平台上,凑成分布式算力池。

但这种“灵活”的背后是浪费:Cast AI的报告显示,企业手里的GPU平均利用率只有5%,95%的资源都在闲置。一边是中小团队抢不到算力,一边是大公司把显卡囤在机房吃灰——这不是真的供应不足,而是算力资源的分配出了问题。

现在的算力市场,像极了20年前的互联网——没有统一的计价标准,没有质量评级,甚至连一份靠谱的租赁合同都没有。你租到的H100,可能因为生产批次不同,性能差了38%;同样是“一小时算力”,不同平台的价格能差出10倍。
行业已经在试着改变:Trillium Technologies把算力使用权打包成证券化产品,在交易所挂牌交易;有些平台开始用“token消耗量”来计价,而不是单纯的时间。更重要的是,国产算力正在跟上——DeepSeek的新模型和华为昇腾完成适配,意味着未来市场不再只有英伟达一个选项。
但这些改变都需要时间。芯片厂的新生产线要3年才能投产,数据中心的电力扩容要等电网改造,统一的算力标准更是需要全行业协商。在那之前,算力的稀缺还会持续,每一次AI的进步,都还会让显卡的租金再跳一次。
当我们谈论AI的未来时,其实是在谈论算力的未来——它不是实验室里的技术参数,是每一个创业者的研发成本,是每一个AI用户的使用门槛,甚至是国家之间科技竞争的核心筹码。
英伟达的市值突破5万亿美元,不是因为它造了最好的显卡,而是它握住了AI时代最稀缺的资源。但稀缺从来都是暂时的,就像20年前没人会为了一条宽带线抢破头,未来的算力也会像水电一样成为基础服务。
算力的价值,从来不在显卡本身,而在它能驱动的创新。