“Token”时代,云厂商的生存法则变了
开年至今,全民掀起了一股“龙虾热”,以OpenClaw为代表的开源AI智能体迅速走红,全球用户忙着养数字员工“干活”,Token消耗量呈指数级暴涨。
为此,英伟达CEO黄仁勋表示发Token当工资;阿里、腾讯也纷纷将Token作为员工福利,这事听起来似乎有点魔幻,但随着Token价格水涨船高,“算力即薪酬”的预言也快成真了。
近日,阿里云、百度云、腾讯云相继对AI算力、存储等相关产品进行调价,最高涨幅超30%。今年1月,亚马逊AWS、谷歌云已先一轮涨价,打破了云计算行业“只降不升”的定价惯性。
云巨头们的涨价理由也高度一致:算力需求持续攀升,核心硬件及相关基础设施成本显著上涨。简单来说,算力的供给已经赶不上消耗。
国家数据局指出,2024年年初,中国日均Token调用量为1000亿;到今年3月,调用规模已突破140万亿,两年增长超千倍,一场“Token革命”正在照进现实。
当AI时代的竞争从“拼模型”转向“争算力”,科技大厂也在加速重构战略版图,谁能更高效地“燃烧”Token,谁就将掌握未来商业的定价权。
云厂商集体“涨价”
Token为什么一下子变得金贵?先搞清楚什么是Token。
Token是AI处理信息时最小的一份“计算单位”,当我们将一句话、一段代码、一张图片交给AI时,它会被切割成一个个Token,大模型再去理解、预测和生成。
简单来说,我们可以将Token理解为发电厂里的计量单位“千瓦时”,用电(使用大模型)越多,电费(消耗的Token)自然越贵。
但Token早期并不贵,甚至是免费的。
2022年底,ChatGPT用大语言模型推开了通用人工智能(AGI)的大门。在接下来的一年里,国内外科技大厂纷纷自研通用大模型,Token的消耗开始被摆上了台面。
国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元;一些更大的LLM模型,训练成本则介于200万美元至1200万美元之间。
虽然训练成本不菲,但在2024年,阿里、字节、百度等大厂不仅采取C端免费的策略,更在B端市场掀起了一场血腥的价格战,将API调用价格从“分”打到“厘”。
在大模型刚刚爆发的窗口期,行业的普遍共识是算力将会越来越便宜,甚至会像如今的宽带资源一样,成为互联网基础设施。
在这样的基础上,大厂依然沿用互联网思维来推演,将模型能力视为入口资源,先通过极低价格吸引开发者与企业入场,争取在商业化落地的过程中获得先发优势。
但剧情并没有如想象般发展。“百模大战”开打仅一年便匆匆落幕,大厂开始意识到,生成式对话所能带来的商业价值有限,大模型要在垂直场景“用起来”,才能释放更多的竞争力。
然而,当AI从“训练”转向“推理”,每一次对话、生成、推理都需要进行新的计算,这意味着Token的需求曲线不再是线性的,而是呈指数级增长。
Claude Code、OpenClaw 等编程智能体的出现,更进一步加大了对Token的需求——智能体可以全年无休地工作,每个智能体还能生成成百上千个子智能体来处理任务的不同部分。
有开发者报告指出,从chatbot到Agent,单次任务的算力消耗将会被放大30-100倍,极端场景下将可能放大1000倍以上。
举个例子,一名学生借助AI完成一篇7500个单词的论文,在不需要修改的情况下,大概要消耗1万个Token,按此推算,单纯的文本对话,一天消耗百万个Token已经算很多了。
但智能体执行一个简单的任务,可能就要触发上百万的Token消耗。有用户表示跑半天OpenClaw,就花掉了5000万Token;还有用户表示用OpenClaw编程,一个月烧掉上千刀。
随着Agent成为更广泛的大众需求,用户也学会了货比三家,更便宜的国产模型开始席卷全球开发者社区,成为了这一轮Token大爆发的最大受益者之一。
前段时间,多家媒体援引知情人士透露消息,称Kimi近20天累计收入已超过2025年全年总收入;刚刚登陆资本市场的Minimax和智谱,股价也再创新高。
但问题是,随着海内外用户的疯狂涌入,Kimi已经隔三差五跳出“高峰时段算力不足”的提示,MiniMax则直接宣布限流……
归根到底,此类国产小模型自己并不拥有GPU,它们想赚“龙虾热”的钱,还要看背后阿里云、腾讯云、火山引擎等云厂商的定价。
可算力的成本也不便宜,GPU市场早已供不应求,当大厂卖Token的收入增速追不上建数据中心的花钱速度,涨价也是必然之举。
竞逐“Token工厂”
过去一年,由于Token需求激增,云厂商的收入也翻了几番。
根据多家媒体报道,火山引擎2025年已完成超200亿元的营收目标,2024年的收入则超120亿元;根据阿里2026财年Q3财报,阿里云收入加速增长36%,增速创三年新高,AI相关产品收入连续第十个季度三位数增长。
但我们不能只看收入不看投入。2025年,阿里的资本支出为1238亿;根据金融时报报道,字节的资本开支约为1500亿,仅靠“卖算力”的话,何时才能填平这笔账?
科技大厂显然并不甘心只当“卖铲人”,既然Token是未来AI竞争的“硬通货”,它们更希望能掌握Token生产、调度和变现的全链路,成为智能时代的“水电煤”。
黄仁勋在英伟达GTC 2026大会上描绘出新的蓝图,他认为英伟达将要从一家“芯片公司”向“AI基础设施和工厂公司”蜕变,不再只是“卖芯片”,而是成为一家“Token工厂”。
目前,英伟达有意通过收购Groq补齐推理短板,其全新发布的Vera CPU能对智能体AI系统进行实时调度与协同,再加上CUDA这个生态护城河,以及其和电力巨头合作打造的新一代AI工厂,未来所有Token从诞生到消耗,都得从英伟达的“Token工厂”里面跑一遍。
根据黄仁勋的分层定价策略,Token的定价将跟算力产出直接挂钩——能力越强,速度越快,定价越贵,而英伟达则握住了这套体系的路线图与定价权。
阿里与英伟达的战略方向也颇为类似,但阿里不仅希望成为Token供应商与基础设施运营商,还希望探索更多新业务,让Token能够被消耗得更多。
近日,阿里成立 Alibaba Token Hub(ATH)事业群,由吴泳铭直接带队,以“创造Token、输送Token、应用Token”为核心目标,进一步强化AI业务战略协同。
之后,阿里推出了企业级AI原生工作平台“悟空”,剑指的是B端市场,首批覆盖电商、设计、制造、财税等十大场景,是能够真正嵌入企业工作流的数据军团。
重新回归阿里的钉钉创始人陈航指出,Token经济学的价值,不在于用机器取代人,在于把这部分庞大的人力资源成本,转化为可放大10倍、100倍的数字生产力。
这跟上一轮企业通过SaaS(软件即服务)提高经营效率的目标是一致的,但SaaS模式主要用于维持运转,而基于Maas(模型即服务)搭建的“悟空”,则能带来可量化的业务增长。一旦企业将算力和数据沉淀在阿里体系,其迁移成本还会越来越高,最终形成核心壁垒。
拥有类似想法的还有字节旗下的火山引擎,其一直将Maas 放在了很高的战略位置,希望以MaaS带动云业务的全面突围。
火山引擎的优势在于,字节拥有抖音、剪映等国民级应用,在如此土壤下跑出的生图、生视频模型能迅速在亿级用户场景中完成验证与迭代,形成“算力-模型-场景”的闭环优势。
比如Seedance 2.0模型凭借突破性能力迅速出圈,不仅吸引了海量用户涌入,更在漫剧等专业场景中实现了规模化落地,直接推动了火山引擎Token消耗量的激增。
根据《晚点 LatePost》的报道,字节火山引擎的豆包大模型日均调用量已超过 100 万亿 Tokens,成为全球第三家Token消耗量过百万亿的云厂商。
不过,国内的云厂商们也不会坐以待毙。阿里CEO吴泳铭表示,新成立的ATH事业群的目标是拿下2026年国内AI云市场增量的80%。
目前,在中国AI云市场中,阿里云以35.8%的占比位列第一;火山引擎以14.8%的占比位列第二。Token争夺战一触即发。
Token成为“流通货币”
虽然路径不同,但科技大厂的战略布局都指向同一个事实:
AI时代的竞争,已不仅仅是模型能力的比拼,科技大厂争夺的是一套Token生产、分发与应用体系的话语权,谁掌握了Token的定价权,就相当于掌握了AI时代最值钱的生产资料。
从前,科技大厂抢夺的是用户的注意力;未来,Token从哪里产生,流向哪里,如何被消耗,才是它们更关注的事情。
首先,以更低成本生产高质量Token。过去,互联网行业的“护城河”是数据、算法、规模等轻资产叙事,但在未来,大厂则要重新拥抱“重资产”,将算力基建作为新的战略高地。
中国有着廉价且稳定的电力供应,再加上科技企业在芯片、模型架构等方面的突破,天然有着算力出海优势,这一轮云厂商集体涨价,也释放出云厂商向全球市场要利润空间的信号。
其次,抢夺Token分发权。大厂掌控着大模型技术,能够将底层算力转化为标准化、可调用的Token服务,进一步降低了用户调用模型能力的门槛。
比如阿里“悟空”切入企业工作平台;微信推出插件支持接入 OpenClaw等,只要用户来部署了,后续自然就会有源源不断的Token消耗,大厂要争抢的是新一轮的“Token入口”。
最后,刺激Token的消耗。拥有Token不一定能形成商业闭环,还要将模型能力嵌进真实业务场景,才能带来可持续的Token消耗。
长远来看,“Token工厂”要的是“消耗-产出”的转化效率,其核心不是卖一次性算力,而是把Token消耗和客户价值真正绑定,能够稳定地、可持续地创造商业收入。
但规则不会一成不变,AI的发展速度已经远超人类想象,没人能预知未来,就像几年前没人能预测到OpenClaw会突然爆火一样。
因此,无论是科技大厂,还是垂直模型公司,又或者是agent工具开发者,大家都还需要在各自擅长的领域,一边奔跑,一边补课。
大厂想要把AI这个虚的概念,变成实的生意,将不再只是参数竞赛,也不是单纯比拼Token的消耗,其最终总会遵循一个最朴素的逻辑:普通人能用好的AI,才是最有价值的AI。
AI 时代真正的商业化入口,可能很近,也可能还有很远。
何小鹏:每年生产和销售100万台全AI汽车是车厂淘汰赛入门券点击图片跳转链接
“人工智能教父”忧心 AI 取代劳动力,建议英国政府实施全民基本收入制度IT之家5月20日消息,人工智能领域先驱GeoffreyHinton因其在神经网络方面的开创性工作而被誉为“人工智能教父”,近日他对人工智能的发展表达了担忧。他表示,人工智能可能会取代大量传统工作,并建议英国政府实施全...
微软发布Windows 11重大更新 人工智能助手Copilot来了11月1日消息,美国时间周二,软件巨头微软发布了个人电脑操作系统Windows11的重大更新版本。其中包含了名为CopilotAI的人工智能助手,与人工智能研究公司OpenAI的热门聊天机器人ChatGPT有许多相似之处。据了解,微软...
OpenAI联合创始人Greg Brockman宣布回归11月13日消息,OpenAI联合创始人兼前总裁格雷格・布罗克曼(GregBrockman)在X发文,宣布正式重返OpenAI。“我人生中最长的假期结束了,现在重新开始建设@OpenAI。”布罗克曼离职还要追溯到阿尔特曼(SamAltman)宫...
成本暴降60% OpenAI宣布开放满血o1模型API12月18日消息,从12月5日开始,OpenAI将在连续12个工作日直播,每天发布一款全新的应用或功能。今天是发布会的第9天,直播内容面向开发者,OpenAI正式发布o1模型的API,并对实时API进行大升级支持WebRTC。即日起,Op...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...