黄仁勋和马云都在抢,看清Token背后的商业模式

和讯网
5 hours ago

昨晚,英伟达CEO黄仁勋发表GTC 2026主题演讲。就在前一天,阿里巴巴成立Token Hub事业群,CEO吴泳铭亲自挂帅。

两家巨头,同一天,盯上同一个东西:Token。Token到底怎么赚钱?咱们今天把它讲清楚。

Token是什么?

黄仁勋给了一个比喻:Token是数字世界的石油

你问ChatGPT一句、生成一段视频、让机器人动一下,消耗的都是Token。它是AI理解和生成信息的基本单位,也是未来所有智能服务的计量单位。

Token怎么收费?企业要付多少钱?

黄仁勋在演讲中首次公开了Token的分层定价体系。这不是概念,是真金白银的收费标准:

免费层:高吞吐量、低速度,用于吸引用户

基础层:每百万Token 3美元,服务普通用户

进阶层:每百万Token 6美元,更大模型、更快速度

高速层:每百万Token 45美元,支持长上下文、深度推理

顶级层:每百万Token 150美元,面向超长研究任务、关键路径实时响应

黄仁勋算了一笔账:“一个研究员每天用5000万Token,按每百万150美元计算,对一个研究团队来说完全可以接受。”

这意味着什么?Token不是一次性买卖,而是持续性消耗。你今天烧完,明天还得烧。只要AI还在跑,Token就在烧。

CUDA的商业模式:为什么黄仁勋敢说“算力越用越便宜”

那英伟达怎么靠Token赚钱?核心是CUDA。你可以把它理解成AI世界的“操作系统”。所有AI应用都得跑在CUDA上,就像所有手机应用都得跑在安卓或iOS上。

CUDA的护城河是数亿级的安装基数

英伟达花了20年时间,让数亿块GPU跑CUDA系统,进入每一朵云、每一家计算机公司、几乎每一个行业。这个安装基数造就了一个飞轮效应:安装基数大,吸引全球开发者;开发者创造新算法,催生新市场;新市场需要更多算力,进一步扩大安装基数。

飞轮转动的结果,就是算力成本持续下降。

黄仁勋举了一个反直觉的例子:六年前出货的Ampere架构GPU,现在在云端的定价反而在上涨。为什么?因为在这块老芯片上能跑的应用越来越多,而且英伟达每优化一次软件,所有存量用户都能免费提速。

这意味着什么?你今天买的算力,过几年不仅不过时,反而可能更值钱。这在硬件行业,几乎是天方夜谭。

黄仁勋的原话是:“一旦安装了NVIDIA GPU,就能获得长期的性能迭代。不仅是初期的加速,更是持续的成本降低。”

这就是CUDA的商业模式:靠硬件建立安装基数,靠软件持续创造价值,靠生态锁定用户。全球数亿块GPU都在跑CUDA,每消耗一个Token,都得从英伟达的平台过一遍。

这就把整个商业逻辑改了。以前企业买AI卡,是一次性开支,属于资本支出。买了就完事,后面跟供应商没关系。现在AI卡变成生产Token的生产线,企业花钱从“买设备”变成了“买燃料”。今天烧完明天还得买,从一次性开支变成了持续性运营。

这叫收租。你今天交,明天还得交。

阿里为什么连夜进场?一场不得不打的硬仗

再看阿里这边的动作。3月16日,阿里巴巴成立Alibaba Token Hub事业群,CEO吴泳铭亲自挂帅,把目标拆成三块:创造Token、输送Token、应用Token

阿里为什么要这么急?

核心痛点在于:AI能力太分散。过去两年,阿里的AI散落在通义实验室、阿里云、钉钉、淘天等各个体系,各团队各干各的,资源重复投入,协同成本越来越高。用户认知也很模糊——通义千问、千问App、夸克AI,同一套技术冒出好几个产品,用户根本分不清。

就在12天前,“千问灵魂人物”林俊旸突然离职,背后正是“科学家想发论文、管理层想要营收”的撕裂。这种冲突在AI行业并不少见。

吴泳铭的解法很直接:把Token变成唯一的指挥棒。未来阿里的评价体系,不再争论技术路线谁对谁错,而是直接折算成Token的调用量和营收。能带来Token增长的部门留下,不能的边缘化。

更深层的逻辑是:阿里判断,未来所有数字化工作,都由数以百亿计的AI Agent支撑。吴泳铭在内部信中直言,“这些AI Agent将由模型产生的Token支撑运行”。而Agent不睡觉,24小时运转,意味着Token需求是持续性的、高频复购的。

如果把Token比作AI时代的“电”,两家巨头的角色很清晰:英伟达是“发电设备制造商”。它卖发电机、建发电厂,靠CUDA生态锁定客户,让所有AI应用都得从它的平台过一遍。

阿里是“电网公司+用电大户”。它有通义实验室负责创造Token,有MaaS平台负责输送Token,还有千问、悟空这些负责消耗Token。从C端的AI助手,到B端的企业工作流,阿里想打通“发电-输电-用电”的完整闭环。

谁的优势更大?英伟达有技术壁垒和生态锁定,单位Token成本有压倒性优势。阿里有场景和数据——电商、云、钉钉、高德、饿了么,每天产生海量数据(603138),也每天消耗海量Token。如果能把闭环跑通,Token在阿里体系内就能自我循环、自我增值。

巨头已经在真金白银抢赛道了。

Token生意的终局

Token这个生意,本质是把算力从“资产”变成了“服务”。从一次性买卖,变成了持续收费。从卖铲子,变成了卖石油。

谁掌握了最低的Token生产成本,谁就掌握了AI时代的定价权。

英伟达有20年积累的CUDA生态,有数亿的安装基数,有每优化一次软件就能惠及所有用户的规模优势。阿里有完整的业务场景,有把Token当成战略资源来打的决心。

两家巨头,同一个判断:Token是AI时代的硬通货。至于英伟达的股价什么时候能回来?等市场不再把它当硬件公司,而是当AI基础设施平台估值的那一天

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10