
智東西
作者 | 李水青
編輯 | 漠影
2026阿里雲峯會,可能是阿里雲成立17年來釋放信號最為密集的一場發布會。
智東西5月20日杭州報道,今天,阿里雲宣佈完成「芯片-雲-模型-推理」全棧Agent化升級,同步推出搭載自研AI芯片真武M890的超節點服務器、最新旗艦模型Qwen3.7-Max、全新AI產品「千問雲」等超50項新品及升級。這是國內雲廠商首次圍繞Agent進行全棧產品發布。
「Agent突破臨界點之後,可以24小時不間斷工作,對AI和雲的需求無窮無盡。」阿里雲資深副總裁劉偉光說,「阿里雲正在進行全棧技術革新,從底層芯片、Agentic Cloud、模型到推理平台全面升級,建設中國最大的AI工廠。」

放眼全球,雲巨頭們正在展開一場全棧AI競賽。谷歌有TPU+Gemini+GCP,亞馬遜有Trainium+Nova+AWS,而阿里雲此次亮出的「芯-雲-模型-推理」全棧體系被業內稱為阿里「通雲哥」:通義+阿里雲+平頭哥。主要發布內容如下:
1. 平頭哥首發新一代訓推一體AI芯片真武M890,性能為上一代3倍,並公布未來兩年路線圖;磐久AL128超節點服務器實現128卡互聯,P2P時延低於150ns。

2. 阿里雲全面邁入Agentic Cloud,發布了至少32項Agentic Cloud新品及更新,覆蓋運行時、編排、治理、安全、記憶、數據平面六大能力;對雲產品進行Skill化、MCP化和CLI化改造,讓Agent像調函數一樣調用雲能力。
3. Qwen3.7-Max正式發布,模型登頂Arena國產第一,可在全新芯片上自主工作35小時,將內核性能提升10倍。(智東西實測→《阿里Qwen3.7競技場殺至國產第一!一手實測:分分鐘破解奧賽難題,圖文視覺全都難不倒》)
4. 百鍊平台開放並池調度、上下文緩存等彈性技術,接入智譜、MiniMax、Kimi等150多款模型。
5. 千問雲官網(www.qianwenai.com)上線,以一行指令替代傳統導航,全面Skill/CLI化,對Agent更友好。
一、李飛飛首秀:連發32大新品及更新
這是阿里雲首席技術官李飛飛自4月8日就任後在峯會上的重要首秀。
李飛飛宣佈,阿里雲通過Agent Infrastructure為Agent負載提供支持,並推出Agentic Products——面向Agent的雲產品。

Agentic時代,雲業務面臨短生命周期、數據模態與存儲形式複雜、無規律突發負載、動態環境依賴、任務級安全管控和大規模動態編排六大挑戰,而Agent Infrastructure以運行時、編排、治理、安全、記憶、數據平面六大能力來應對挑戰:

具體到運行環境,阿里雲為Agent構建了完整的支撐體系:輕量高效的沙箱執行環境、多Agent協同能力、跨任務的記憶能力、順暢的數據流轉通路,以及全域智能運維能力。
Agentic Cloud運行時五大新品及更新如下:

Agentic Cloud編排一大新品及更新如下:

Agentic Cloud治理四大新品及更新如下:

Agentic Cloud安全五大新品及更新如下:

Agentic Cloud記憶七大新品及更新如下:

Agentic Cloud數據平面十大新品及更新:

阿里雲Agent Infrastructure已助MiniMax企業級Agent大規模落地。

有了這些產品及更新,未來一個開發者只需要給Agent一句自然語言指令,Agent就能自動完成從資源識別到應用部署的全流程,無需人工點擊控制台或編寫複雜腳本。
李飛飛認為,傳統雲產品的交互邏輯是為人設計的,用戶看着控制台點擊按鈕,或者通過API編寫代碼調用。但Agent的工作負載是「無規律彈性、短生命周期、瞬時起量即走」,與傳統雲計算的穩態負載截然不同。

傳統雲產品打開控制台,看到一堆菜單、配置項、儀表盤,這些視覺化信息對人很友好,但對Agent毫無意義。為此,阿里雲對雲產品進行了Skill化、MCP化和CLI化改造,讓每一個雲產品都變成Agent可以「像調函數一樣調用」的標準化能力模塊。

阿里雲不是在雲上加一層Agent接口,而是把雲本身變成Agent能用的東西。這套改造的野心在於讓雲從「人的工具」變成「Agent的操作系統」。

二、平頭哥首發真武M890,扔出128卡超節點算力王炸
芯片層,阿里雲亮出了一張目前國內雲廠商中獨一份的王牌:覆蓋算力、網絡、存儲的完整自研數據中心芯片矩陣。
峯會現場,平頭哥新一代訓推一體AI芯片真武M890首次亮相。規格相當硬核:144GB顯存,片間互聯帶寬800GB/s,性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多種數據精度,可應用於高精度訓練到超低精度推理的全場景。在低精度推理場景下,不僅能保證模型輸出質量,還能顯著降低單次推理的算力開銷。
更值得關注的是基於真武M890的磐久AL128超節點服務器,搭載自研互聯芯片ICN Switch 1.0。這個超節點可讓128張AI芯片組成一台計算機,P2P時延低於150ns,單櫃帶寬達到Pb/s級。
為什麼要做這麼大的超節點?因為Agentic時代,算力集群需要承載成千上萬個Agent同時運行,每個Agent在一次任務中可能連續發起數十次模型調用,對通信時延和帶寬的要求是指數級上升的。該超節點已上線阿里雲百鍊,支持Qwen、DeepSeek、Kimi等主流模型。

平頭哥還首次公布了真武系列芯片的路線規劃:未來兩年將陸續推出算力更強的真武V900、真武J900兩代芯片。目前真武系列AI芯片累計出貨56萬片,已服務中國電信、中國一汽、浦發銀行等20多個行業的400多家客戶。

加上自研的倚天系列CPU、磐脈智能網卡、鎮岳存儲主控芯片、ICN Switch互聯芯片,平頭哥的芯片版圖已經從「單點突破」走到了「全面覆蓋」。
三、Qwen3.7-Max來了,登頂Arena榜,勝任35小時長程任務
Qwen3.7-Max是阿里巴巴最新發布的旗艦大模型。

在三方機構Arena全球大模型盲測總榜中,它超過Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1,與GPT、Claude、Gemini最強模型接近,位列國產模型第一。在細分排行榜上,數學排名第7、專家任務第9、編程任務第10,表現相當均衡。

比跑分更有說服力的,是一個堪稱「極限測試」的實戰案例。在模型訓練時從未接觸過的全新硬件平台——平頭哥真武M890芯片上,Qwen3.7-Max僅憑一份任務說明,從零開始自主工作35小時,獨立進行了432次內核評估、1158次工具調用,完全自主地完成了編寫、編譯、性能分析與迭代改進的全流程。最終,它優化後的推理內核比SGLang Triton官方參考實現快了10倍。

沒有人類干預,沒有中間指導,35小時,從零到生產級。測試軌跡還顯示,模型在獨立運行超過30小時後仍發現了有效優化點,甚至主動發起了一次關鍵的架構重設計。這個案例展示的不是模型「回答問題」的能力,而是模型「自主完成複雜工程任務」的能力——這恰恰是Agent場景最核心的需求。

阿里巴巴通義大模型事業部負責人周靖人談道:「大模型正在經歷一次核心範式轉移——從對齊人類偏好,到對齊任務目標。過去我們追求的是模型‘說得好’,現在要求模型‘做得到’。Qwen3.7-Max的設計初衷,就是讓模型真正成為Agent的智能內核,具備自主規劃、持續迭代、跨工具協作的能力。」

值得注意的是,近3個月內,千問旗艦模型已經連續迭代了3.5、3.6、3.7三個版本,保持着極高的發布節奏。阿里巴巴顯然在刻意加速模型進化,以匹配Agent時代對模型能力的指數級增長需求。
四、百鍊平台全面開放,智譜、Minimax、Kimi等頂尖模型首批上架
如果說芯片是地基、模型是引擎,那百鍊推理平台就是Agent真正跑起來的「生產車間」。
阿里雲在百鍊平台上構建了大規模GPU資源集群,並通過一套完整的技術棧應對Agent場景的特殊挑戰:並池調度將GPU資源統一調度提升利用率;上下文緩存消除多輪對話和長鏈路任務中的重複計算開銷;吞吐彈性調度應對併發請求的波峯波谷;Agentic RL基於實際執行反饋讓模型持續迭代。此外,百鍊內建了安全治理能力——在Agent自主運行的語境下,一個24小時不間斷執行任務的Agent如果沒有邊界約束,後果不可控。百鍊的安全機制確保Agent始終在預設的權限範圍內行動。

在生態策略上,百鍊保持開放接入。峯會當天,阿里雲宣佈與月之暗面、Minimax、智譜、階躍星辰、愛詩科技、生數科技等達成合作,GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百鍊,並通過千問雲官網全面售賣。目前百鍊已提供150多款主流模型API。
百鍊不僅提供阿里自研模型服務,同時面向頭部AI廠商開放,為用戶提供「一個入口、多模型可選」的一站式服務體驗。目前百鍊已推出按需、按時長的靈活計費模式,用戶可通過統一SDK接口接入不同模型,實現靈活切換與高效迭代。據阿里最新財報,截至2026年3月,百鍊平台該季度客戶數量按年增長了8倍。
五、首發千問雲,全面Skill和CLI化,對Agent更友好
千問雲是阿里雲成立17年來,首次在阿里雲官網之外推出的全新產品官網。打開頁面,突出的不是產品列表,也不是控制台,沒有任何傳統意義上的導航結構。首頁只有一行字:
安裝 Skills npx skills add QianWen-AI/qianwen-ai
這是一條Agent可讀的prompt指令。阿里雲將所有模型服務的核心能力封裝為標準化的Skills和CLI工具,智能體可以直接解析這條指令,「學會」網站的全部能力,並根據需求自主調用。

過去十年,雲的交互邏輯是「人登入控制台→選產品→配參數→調API」。這套流程對人類來說已經足夠順暢,但對Agent來說完全不可用。Agent不看網頁,不點按鈕,它需要的是結構化的能力描述、明確的調用協議和可預期的反饋機制。
千問雲Skills將模型選型、調用、認證配置、用量查詢等完整鏈路能力封裝,用戶無需編寫任何代碼,Agent即可動態路由不同模型——自動用視覺模型處理圖片,用生圖模型生成圖片,用視頻生成模型創作視頻。千問雲CLI則可覆蓋登入認證、模型查詢、調用、用量查詢和環境診斷等能力,直接通過腳本或命令行自動化完成所有模型服務的工作流。
基於千問雲Skills和CLI,Agent還能實時拉取模型用量數據,自動分析趨勢、識別異常,為用戶提供成本優化建議。目前,千問雲Skills和CLI均已在GitHub開源。付費模式上,千問雲提供按量付費和Token Plan訂閱兩種模式,後者適用於高頻AI編程和Agent場景,可顯著降低Token成本。
結語:全球雲巨頭展開AI全棧競賽
當雲的主要消費者從人變成Agent,所有圍繞人類設計的界面、流程和交互邏輯,都將被重寫。
從芯片真武M890,到Agentic Cloud,到Qwen3.7-Max,到百鍊平台,再到千問雲……阿里雲在2026年5月20日這一天,完成了一次從底層到入口的全鏈路重構。
放眼全球,這場競賽啱啱進入深水區。谷歌以TPU+Gemini+GCP構築閉環,亞馬遜以Trainium+Nova+AWS正面迎戰,微軟手握Maia+ Copilot+Azure。而阿里雲此次亮出的「芯-雲-模型-推理」全棧體系,證明了中國雲廠商有能力在同一張牌桌上競爭。
吳泳銘在財報電話會上把AI投入比作建設「訓練工廠」和「推理工廠」。今天,這兩座工廠已經開始全速運轉。未來三年,阿里雲的AI算力規模將比2022年增長十倍,是已經在執行的計劃。
值得一提的是,阿里雲選擇了「開放」作為差異化路徑——百鍊平台接入150多款模型,千問雲Skills和CLI全部開源,這既是生態策略,也是對Agent時代「沒有一家模型能通喫一切」這一底層判斷的回應。