阿里李飛飛首秀：一口氣面向Agent發了32個新品

智東西

作者 | 李水青

編輯 | 漠影

2026阿里雲峯會，可能是阿里雲成立17年來釋放信號最為密集的一場發布會。

智東西5月20日杭州報道，今天，阿里雲宣佈完成「芯片-雲-模型-推理」全棧Agent化升級，同步推出搭載自研AI芯片真武M890的超節點服務器、最新旗艦模型Qwen3.7-Max、全新AI產品「千問雲」等超50項新品及升級。這是國內雲廠商首次圍繞Agent進行全棧產品發布。

「Agent突破臨界點之後，可以24小時不間斷工作，對AI和雲的需求無窮無盡。」阿里雲資深副總裁劉偉光說，「阿里雲正在進行全棧技術革新，從底層芯片、Agentic Cloud、模型到推理平台全面升級，建設中國最大的AI工廠。」

放眼全球，雲巨頭們正在展開一場全棧AI競賽。谷歌有TPU+Gemini+GCP，亞馬遜有Trainium+Nova+AWS，而阿里雲此次亮出的「芯-雲-模型-推理」全棧體系被業內稱為阿里「通雲哥」：通義+阿里雲+平頭哥。主要發布內容如下：

1. 平頭哥首發新一代訓推一體AI芯片真武M890，性能為上一代3倍，並公布未來兩年路線圖；磐久AL128超節點服務器實現128卡互聯，P2P時延低於150ns。

2. 阿里雲全面邁入Agentic Cloud，發布了至少32項Agentic Cloud新品及更新，覆蓋運行時、編排、治理、安全、記憶、數據平面六大能力；對雲產品進行Skill化、MCP化和CLI化改造，讓Agent像調函數一樣調用雲能力。

3. Qwen3.7-Max正式發布，模型登頂Arena國產第一，可在全新芯片上自主工作35小時，將內核性能提升10倍。（智東西實測→《阿里Qwen3.7競技場殺至國產第一！一手實測：分分鐘破解奧賽難題，圖文視覺全都難不倒》）

4. 百鍊平台開放並池調度、上下文緩存等彈性技術，接入智譜、MiniMax、Kimi等150多款模型。

5. 千問雲官網（www.qianwenai.com）上線，以一行指令替代傳統導航，全面Skill/CLI化，對Agent更友好。

一、李飛飛首秀：連發32大新品及更新

這是阿里雲首席技術官李飛飛自4月8日就任後在峯會上的重要首秀。

李飛飛宣佈，阿里雲通過Agent Infrastructure為Agent負載提供支持，並推出Agentic Products——面向Agent的雲產品。

Agentic時代，雲業務面臨短生命周期、數據模態與存儲形式複雜、無規律突發負載、動態環境依賴、任務級安全管控和大規模動態編排六大挑戰，而Agent Infrastructure以運行時、編排、治理、安全、記憶、數據平面六大能力來應對挑戰：

具體到運行環境，阿里雲為Agent構建了完整的支撐體系：輕量高效的沙箱執行環境、多Agent協同能力、跨任務的記憶能力、順暢的數據流轉通路，以及全域智能運維能力。

Agentic Cloud運行時五大新品及更新如下：

Agentic Cloud編排一大新品及更新如下：

Agentic Cloud治理四大新品及更新如下：

Agentic Cloud安全五大新品及更新如下：

Agentic Cloud記憶七大新品及更新如下：

Agentic Cloud數據平面十大新品及更新：

阿里雲Agent Infrastructure已助MiniMax企業級Agent大規模落地。

有了這些產品及更新，未來一個開發者只需要給Agent一句自然語言指令，Agent就能自動完成從資源識別到應用部署的全流程，無需人工點擊控制台或編寫複雜腳本。

李飛飛認為，傳統雲產品的交互邏輯是為人設計的，用戶看着控制台點擊按鈕，或者通過API編寫代碼調用。但Agent的工作負載是「無規律彈性、短生命周期、瞬時起量即走」，與傳統雲計算的穩態負載截然不同。

傳統雲產品打開控制台，看到一堆菜單、配置項、儀表盤，這些視覺化信息對人很友好，但對Agent毫無意義。為此，阿里雲對雲產品進行了Skill化、MCP化和CLI化改造，讓每一個雲產品都變成Agent可以「像調函數一樣調用」的標準化能力模塊。

阿里雲不是在雲上加一層Agent接口，而是把雲本身變成Agent能用的東西。這套改造的野心在於讓雲從「人的工具」變成「Agent的操作系統」。

二、平頭哥首發真武M890，扔出128卡超節點算力王炸

芯片層，阿里雲亮出了一張目前國內雲廠商中獨一份的王牌：覆蓋算力、網絡、存儲的完整自研數據中心芯片矩陣。

峯會現場，平頭哥新一代訓推一體AI芯片真武M890首次亮相。規格相當硬核：144GB顯存，片間互聯帶寬800GB/s，性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多種數據精度，可應用於高精度訓練到超低精度推理的全場景。在低精度推理場景下，不僅能保證模型輸出質量，還能顯著降低單次推理的算力開銷。

更值得關注的是基於真武M890的磐久AL128超節點服務器，搭載自研互聯芯片ICN Switch 1.0。這個超節點可讓128張AI芯片組成一台計算機，P2P時延低於150ns，單櫃帶寬達到Pb/s級。

為什麼要做這麼大的超節點？因為Agentic時代，算力集群需要承載成千上萬個Agent同時運行，每個Agent在一次任務中可能連續發起數十次模型調用，對通信時延和帶寬的要求是指數級上升的。該超節點已上線阿里雲百鍊，支持Qwen、DeepSeek、Kimi等主流模型。

平頭哥還首次公布了真武系列芯片的路線規劃：未來兩年將陸續推出算力更強的真武V900、真武J900兩代芯片。目前真武系列AI芯片累計出貨56萬片，已服務中國電信、中國一汽、浦發銀行等20多個行業的400多家客戶。

加上自研的倚天系列CPU、磐脈智能網卡、鎮岳存儲主控芯片、ICN Switch互聯芯片，平頭哥的芯片版圖已經從「單點突破」走到了「全面覆蓋」。

三、Qwen3.7-Max來了，登頂Arena榜，勝任35小時長程任務

Qwen3.7-Max是阿里巴巴最新發布的旗艦大模型。

在三方機構Arena全球大模型盲測總榜中，它超過Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1，與GPT、Claude、Gemini最強模型接近，位列國產模型第一。在細分排行榜上，數學排名第7、專家任務第9、編程任務第10，表現相當均衡。

比跑分更有說服力的，是一個堪稱「極限測試」的實戰案例。在模型訓練時從未接觸過的全新硬件平台——平頭哥真武M890芯片上，Qwen3.7-Max僅憑一份任務說明，從零開始自主工作35小時，獨立進行了432次內核評估、1158次工具調用，完全自主地完成了編寫、編譯、性能分析與迭代改進的全流程。最終，它優化後的推理內核比SGLang Triton官方參考實現快了10倍。

沒有人類干預，沒有中間指導，35小時，從零到生產級。測試軌跡還顯示，模型在獨立運行超過30小時後仍發現了有效優化點，甚至主動發起了一次關鍵的架構重設計。這個案例展示的不是模型「回答問題」的能力，而是模型「自主完成複雜工程任務」的能力——這恰恰是Agent場景最核心的需求。

阿里巴巴通義大模型事業部負責人周靖人談道：「大模型正在經歷一次核心範式轉移——從對齊人類偏好，到對齊任務目標。過去我們追求的是模型‘說得好’，現在要求模型‘做得到’。Qwen3.7-Max的設計初衷，就是讓模型真正成為Agent的智能內核，具備自主規劃、持續迭代、跨工具協作的能力。」

值得注意的是，近3個月內，千問旗艦模型已經連續迭代了3.5、3.6、3.7三個版本，保持着極高的發布節奏。阿里巴巴顯然在刻意加速模型進化，以匹配Agent時代對模型能力的指數級增長需求。

四、百鍊平台全面開放，智譜、Minimax、Kimi等頂尖模型首批上架

如果說芯片是地基、模型是引擎，那百鍊推理平台就是Agent真正跑起來的「生產車間」。

阿里雲在百鍊平台上構建了大規模GPU資源集群，並通過一套完整的技術棧應對Agent場景的特殊挑戰：並池調度將GPU資源統一調度提升利用率；上下文緩存消除多輪對話和長鏈路任務中的重複計算開銷；吞吐彈性調度應對併發請求的波峯波谷；Agentic RL基於實際執行反饋讓模型持續迭代。此外，百鍊內建了安全治理能力——在Agent自主運行的語境下，一個24小時不間斷執行任務的Agent如果沒有邊界約束，後果不可控。百鍊的安全機制確保Agent始終在預設的權限範圍內行動。

在生態策略上，百鍊保持開放接入。峯會當天，阿里雲宣佈與月之暗面、Minimax、智譜、階躍星辰、愛詩科技、生數科技等達成合作，GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百鍊，並通過千問雲官網全面售賣。目前百鍊已提供150多款主流模型API。

百鍊不僅提供阿里自研模型服務，同時面向頭部AI廠商開放，為用戶提供「一個入口、多模型可選」的一站式服務體驗。目前百鍊已推出按需、按時長的靈活計費模式，用戶可通過統一SDK接口接入不同模型，實現靈活切換與高效迭代。據阿里最新財報，截至2026年3月，百鍊平台該季度客戶數量按年增長了8倍。

五、首發千問雲，全面Skill和CLI化，對Agent更友好

千問雲是阿里雲成立17年來，首次在阿里雲官網之外推出的全新產品官網。打開頁面，突出的不是產品列表，也不是控制台，沒有任何傳統意義上的導航結構。首頁只有一行字：

安裝 Skills npx skills add QianWen-AI/qianwen-ai

這是一條Agent可讀的prompt指令。阿里雲將所有模型服務的核心能力封裝為標準化的Skills和CLI工具，智能體可以直接解析這條指令，「學會」網站的全部能力，並根據需求自主調用。

過去十年，雲的交互邏輯是「人登入控制台→選產品→配參數→調API」。這套流程對人類來說已經足夠順暢，但對Agent來說完全不可用。Agent不看網頁，不點按鈕，它需要的是結構化的能力描述、明確的調用協議和可預期的反饋機制。

千問雲Skills將模型選型、調用、認證配置、用量查詢等完整鏈路能力封裝，用戶無需編寫任何代碼，Agent即可動態路由不同模型——自動用視覺模型處理圖片，用生圖模型生成圖片，用視頻生成模型創作視頻。千問雲CLI則可覆蓋登入認證、模型查詢、調用、用量查詢和環境診斷等能力，直接通過腳本或命令行自動化完成所有模型服務的工作流。

基於千問雲Skills和CLI，Agent還能實時拉取模型用量數據，自動分析趨勢、識別異常，為用戶提供成本優化建議。目前，千問雲Skills和CLI均已在GitHub開源。付費模式上，千問雲提供按量付費和Token Plan訂閱兩種模式，後者適用於高頻AI編程和Agent場景，可顯著降低Token成本。

結語：全球雲巨頭展開AI全棧競賽

當雲的主要消費者從人變成Agent，所有圍繞人類設計的界面、流程和交互邏輯，都將被重寫。

從芯片真武M890，到Agentic Cloud，到Qwen3.7-Max，到百鍊平台，再到千問雲……阿里雲在2026年5月20日這一天，完成了一次從底層到入口的全鏈路重構。

放眼全球，這場競賽啱啱進入深水區。谷歌以TPU+Gemini+GCP構築閉環，亞馬遜以Trainium+Nova+AWS正面迎戰，微軟手握Maia+ Copilot+Azure。而阿里雲此次亮出的「芯-雲-模型-推理」全棧體系，證明了中國雲廠商有能力在同一張牌桌上競爭。

吳泳銘在財報電話會上把AI投入比作建設「訓練工廠」和「推理工廠」。今天，這兩座工廠已經開始全速運轉。未來三年，阿里雲的AI算力規模將比2022年增長十倍，是已經在執行的計劃。

值得一提的是，阿里雲選擇了「開放」作為差異化路徑——百鍊平台接入150多款模型，千問雲Skills和CLI全部開源，這既是生態策略，也是對Agent時代「沒有一家模型能通喫一切」這一底層判斷的回應。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

阿里李飛飛首秀：一口氣面向Agent發了32個新品

熱議股票