
昨晚,英偉達CEO黃仁勳發表GTC 2026主題演講。就在前一天,阿里巴巴成立Token Hub事業群,CEO吳泳銘親自掛帥。
兩家巨頭,同一天,盯上同一個東西:Token。Token到底怎麼賺錢?咱們今天把它講清楚。

Token是什麼?
黃仁勳給了一個比喻:Token是數字世界的石油。
你問ChatGPT一句、生成一段視頻、讓機器人動一下,消耗的都是Token。它是AI理解和生成信息的基本單位,也是未來所有智能服務的計量單位。

Token怎麼收費?企業要付多少錢?
黃仁勳在演講中首次公開了Token的分層定價體系。這不是概念,是真金白銀的收費標準:
免費層:高吞吐量、低速度,用於吸引用戶
基礎層:每百萬Token 3美元,服務普通用戶
進階層:每百萬Token 6美元,更大模型、更快速度
高速層:每百萬Token 45美元,支持長上下文、深度推理
頂級層:每百萬Token 150美元,面向超長研究任務、關鍵路徑實時響應
黃仁勳算了一筆賬:「一個研究員每天用5000萬Token,按每百萬150美元計算,對一個研究團隊來說完全可以接受。」
這意味着什麼?Token不是一次性買賣,而是持續性消耗。你今天燒完,明天還得燒。只要AI還在跑,Token就在燒。


CUDA的商業模式:為什麼黃仁勳敢說「算力越用越便宜」
那英偉達怎麼靠Token賺錢?核心是CUDA。你可以把它理解成AI世界的「操作系統」。所有AI應用都得跑在CUDA上,就像所有手機應用都得跑在安卓或iOS上。
CUDA的護城河是數億級的安裝基數。
英偉達花了20年時間,讓數億塊GPU跑CUDA系統,進入每一朵雲、每一家計算機公司、幾乎每一個行業。這個安裝基數造就了一個飛輪效應:安裝基數大,吸引全球開發者;開發者創造新算法,催生新市場;新市場需要更多算力,進一步擴大安裝基數。
飛輪轉動的結果,就是算力成本持續下降。
黃仁勳舉了一個反直覺的例子:六年前出貨的Ampere架構GPU,現在在雲端的定價反而在上漲。為什麼?因為在這塊老芯片上能跑的應用越來越多,而且英偉達每優化一次軟件,所有存量用戶都能免費提速。
這意味着什麼?你今天買的算力,過幾年不僅不過時,反而可能更值錢。這在硬件行業,幾乎是天方夜譚。
黃仁勳的原話是:「一旦安裝了NVIDIA GPU,就能獲得長期的性能迭代。不僅是初期的加速,更是持續的成本降低。」
這就是CUDA的商業模式:靠硬件建立安裝基數,靠軟件持續創造價值,靠生態鎖定用戶。全球數億塊GPU都在跑CUDA,每消耗一個Token,都得從英偉達的平台過一遍。
這就把整個商業邏輯改了。以前企業買AI卡,是一次性開支,屬於資本支出。買了就完事,後面跟供應商沒關係。現在AI卡變成生產Token的生產線,企業花錢從「買設備」變成了「買燃料」。今天燒完明天還得買,從一次性開支變成了持續性運營。
這叫收租。你今天交,明天還得交。


阿里為什麼連夜進場?一場不得不打的硬仗
再看阿里這邊的動作。3月16日,阿里巴巴成立Alibaba Token Hub事業群,CEO吳泳銘親自掛帥,把目標拆成三塊:創造Token、輸送Token、應用Token。
阿里為什麼要這麼急?
核心痛點在於:AI能力太分散。過去兩年,阿里的AI散落在通義實驗室、阿里雲、釘釘、淘天等各個體系,各團隊各幹各的,資源重複投入,協同成本越來越高。用戶認知也很模糊——通義千問、千問App、夸克AI,同一套技術冒出好幾個產品,用戶根本分不清。
就在12天前,「千問靈魂人物」林俊暘突然離職,背後正是「科學家想發論文、管理層想要營收」的撕裂。這種衝突在AI行業並不少見。
吳泳銘的解法很直接:把Token變成唯一的指揮棒。未來阿里的評價體系,不再爭論技術路線誰對誰錯,而是直接折算成Token的調用量和營收。能帶來Token增長的部門留下,不能的邊緣化。
更深層的邏輯是:阿里判斷,未來所有數字化工作,都由數以百億計的AI Agent支撐。吳泳銘在內部信中直言,「這些AI Agent將由模型產生的Token支撐運行」。而Agent不睡覺,24小時運轉,意味着Token需求是持續性的、高頻復購的。
如果把Token比作AI時代的「電」,兩家巨頭的角色很清晰:英偉達是「發電設備製造商」。它賣發電機、建發電廠,靠CUDA生態鎖定客戶,讓所有AI應用都得從它的平台過一遍。
阿里是「電網公司+用電大戶」。它有通義實驗室負責創造Token,有MaaS平台負責輸送Token,還有千問、悟空這些負責消耗Token。從C端的AI助手,到B端的企業工作流,阿里想打通「發電-輸電-用電」的完整閉環。
誰的優勢更大?英偉達有技術壁壘和生態鎖定,單位Token成本有壓倒性優勢。阿里有場景和數據——電商、雲、釘釘、高德、餓了麼,每天產生海量數據(603138),也每天消耗海量Token。如果能把閉環跑通,Token在阿里體系內就能自我循環、自我增值。
巨頭已經在真金白銀搶賽道了。


Token生意的終局
Token這個生意,本質是把算力從「資產」變成了「服務」。從一次性買賣,變成了持續收費。從賣鏟子,變成了賣石油。
誰掌握了最低的Token生產成本,誰就掌握了AI時代的定價權。
英偉達有20年積累的CUDA生態,有數億的安裝基數,有每優化一次軟件就能惠及所有用戶的規模優勢。阿里有完整的業務場景,有把Token當成戰略資源來打的決心。
兩家巨頭,同一個判斷:Token是AI時代的硬通貨。至於英偉達的股價什麼時候能回來?等市場不再把它當硬件公司,而是當AI基礎設施平台估值的那一天。