
昨晚,英伟达CEO黄仁勋发表GTC 2026主题演讲。就在前一天,阿里巴巴成立Token Hub事业群,CEO吴泳铭亲自挂帅。
两家巨头,同一天,盯上同一个东西:Token。Token到底怎么赚钱?咱们今天把它讲清楚。

Token是什么?
黄仁勋给了一个比喻:Token是数字世界的石油。
你问ChatGPT一句、生成一段视频、让机器人动一下,消耗的都是Token。它是AI理解和生成信息的基本单位,也是未来所有智能服务的计量单位。

Token怎么收费?企业要付多少钱?
黄仁勋在演讲中首次公开了Token的分层定价体系。这不是概念,是真金白银的收费标准:
免费层:高吞吐量、低速度,用于吸引用户
基础层:每百万Token 3美元,服务普通用户
进阶层:每百万Token 6美元,更大模型、更快速度
高速层:每百万Token 45美元,支持长上下文、深度推理
顶级层:每百万Token 150美元,面向超长研究任务、关键路径实时响应
黄仁勋算了一笔账:“一个研究员每天用5000万Token,按每百万150美元计算,对一个研究团队来说完全可以接受。”
这意味着什么?Token不是一次性买卖,而是持续性消耗。你今天烧完,明天还得烧。只要AI还在跑,Token就在烧。


CUDA的商业模式:为什么黄仁勋敢说“算力越用越便宜”
那英伟达怎么靠Token赚钱?核心是CUDA。你可以把它理解成AI世界的“操作系统”。所有AI应用都得跑在CUDA上,就像所有手机应用都得跑在安卓或iOS上。
CUDA的护城河是数亿级的安装基数。
英伟达花了20年时间,让数亿块GPU跑CUDA系统,进入每一朵云、每一家计算机公司、几乎每一个行业。这个安装基数造就了一个飞轮效应:安装基数大,吸引全球开发者;开发者创造新算法,催生新市场;新市场需要更多算力,进一步扩大安装基数。
飞轮转动的结果,就是算力成本持续下降。
黄仁勋举了一个反直觉的例子:六年前出货的Ampere架构GPU,现在在云端的定价反而在上涨。为什么?因为在这块老芯片上能跑的应用越来越多,而且英伟达每优化一次软件,所有存量用户都能免费提速。
这意味着什么?你今天买的算力,过几年不仅不过时,反而可能更值钱。这在硬件行业,几乎是天方夜谭。
黄仁勋的原话是:“一旦安装了NVIDIA GPU,就能获得长期的性能迭代。不仅是初期的加速,更是持续的成本降低。”
这就是CUDA的商业模式:靠硬件建立安装基数,靠软件持续创造价值,靠生态锁定用户。全球数亿块GPU都在跑CUDA,每消耗一个Token,都得从英伟达的平台过一遍。
这就把整个商业逻辑改了。以前企业买AI卡,是一次性开支,属于资本支出。买了就完事,后面跟供应商没关系。现在AI卡变成生产Token的生产线,企业花钱从“买设备”变成了“买燃料”。今天烧完明天还得买,从一次性开支变成了持续性运营。
这叫收租。你今天交,明天还得交。


阿里为什么连夜进场?一场不得不打的硬仗
再看阿里这边的动作。3月16日,阿里巴巴成立Alibaba Token Hub事业群,CEO吴泳铭亲自挂帅,把目标拆成三块:创造Token、输送Token、应用Token。
阿里为什么要这么急?
核心痛点在于:AI能力太分散。过去两年,阿里的AI散落在通义实验室、阿里云、钉钉、淘天等各个体系,各团队各干各的,资源重复投入,协同成本越来越高。用户认知也很模糊——通义千问、千问App、夸克AI,同一套技术冒出好几个产品,用户根本分不清。
就在12天前,“千问灵魂人物”林俊旸突然离职,背后正是“科学家想发论文、管理层想要营收”的撕裂。这种冲突在AI行业并不少见。
吴泳铭的解法很直接:把Token变成唯一的指挥棒。未来阿里的评价体系,不再争论技术路线谁对谁错,而是直接折算成Token的调用量和营收。能带来Token增长的部门留下,不能的边缘化。
更深层的逻辑是:阿里判断,未来所有数字化工作,都由数以百亿计的AI Agent支撑。吴泳铭在内部信中直言,“这些AI Agent将由模型产生的Token支撑运行”。而Agent不睡觉,24小时运转,意味着Token需求是持续性的、高频复购的。
如果把Token比作AI时代的“电”,两家巨头的角色很清晰:英伟达是“发电设备制造商”。它卖发电机、建发电厂,靠CUDA生态锁定客户,让所有AI应用都得从它的平台过一遍。
阿里是“电网公司+用电大户”。它有通义实验室负责创造Token,有MaaS平台负责输送Token,还有千问、悟空这些负责消耗Token。从C端的AI助手,到B端的企业工作流,阿里想打通“发电-输电-用电”的完整闭环。
谁的优势更大?英伟达有技术壁垒和生态锁定,单位Token成本有压倒性优势。阿里有场景和数据——电商、云、钉钉、高德、饿了么,每天产生海量数据(603138),也每天消耗海量Token。如果能把闭环跑通,Token在阿里体系内就能自我循环、自我增值。
巨头已经在真金白银抢赛道了。


Token生意的终局
Token这个生意,本质是把算力从“资产”变成了“服务”。从一次性买卖,变成了持续收费。从卖铲子,变成了卖石油。
谁掌握了最低的Token生产成本,谁就掌握了AI时代的定价权。
英伟达有20年积累的CUDA生态,有数亿的安装基数,有每优化一次软件就能惠及所有用户的规模优势。阿里有完整的业务场景,有把Token当成战略资源来打的决心。
两家巨头,同一个判断:Token是AI时代的硬通货。至于英伟达的股价什么时候能回来?等市场不再把它当硬件公司,而是当AI基础设施平台估值的那一天。