阿里李飞飞首秀:一口气面向Agent发了32个新品

智东西
May 21

智东西

作者 | 李水青

编辑 | 漠影

2026阿里云峰会,可能是阿里云成立17年来释放信号最为密集的一场发布会。

智东西5月20日杭州报道,今天,阿里云宣布完成“芯片-云-模型-推理”全栈Agent化升级,同步推出搭载自研AI芯片真武M890超节点服务器、最新旗舰模型Qwen3.7-Max、全新AI产品“千问云”等超50项新品及升级。这是国内云厂商首次围绕Agent进行全栈产品发布。

“Agent突破临界点之后,可以24小时不间断工作,对AI和云的需求无穷无尽。”阿里云资深副总裁刘伟光说,“阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。”

放眼全球,云巨头们正在展开一场全栈AI竞赛。谷歌有TPU+Gemini+GCP亚马逊有Trainium+Nova+AWS,而阿里云此次亮出的“芯-云-模型-推理”全栈体系被业内称为阿里“通云哥”:通义+阿里云+平头哥。主要发布内容如下:

1. 平头哥首发新一代训推一体AI芯片真武M890,性能为上一代3倍,并公布未来两年路线图;磐久AL128超节点服务器实现128卡互联,P2P时延低于150ns。

2. 阿里云全面迈入Agentic Cloud,发布了至少32项Agentic Cloud新品及更新,覆盖运行时、编排、治理、安全、记忆、数据平面六大能力;对云产品进行Skill化、MCP化和CLI化改造,让Agent像调函数一样调用云能力。

3. Qwen3.7-Max正式发布,模型登顶Arena国产第一,可在全新芯片上自主工作35小时,将内核性能提升10倍。(智东西实测→《阿里Qwen3.7竞技场杀至国产第一!一手实测:分分钟破解奥赛难题,图文视觉全都难不倒》)

4. 百炼平台开放并池调度、上下文缓存等弹性技术,接入智谱、MiniMax、Kimi等150多款模型。

5. 千问云官网(www.qianwenai.com)上线,以一行指令替代传统导航,全面Skill/CLI化,对Agent更友好。

一、李飞飞首秀:连发32大新品及更新

这是阿里云首席技术官李飞飞自4月8日就任后在峰会上的重要首秀。

李飞飞宣布,阿里云通过Agent Infrastructure为Agent负载提供支持,并推出Agentic Products——面向Agent的云产品。

Agentic时代,云业务面临短生命周期、数据模态与存储形式复杂、无规律突发负载、动态环境依赖、任务级安全管控和大规模动态编排六大挑战,而Agent Infrastructure以运行时、编排、治理、安全、记忆、数据平面六大能力来应对挑战:

具体到运行环境,阿里云为Agent构建了完整的支撑体系:轻量高效的沙箱执行环境、多Agent协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。

Agentic Cloud运行时五大新品及更新如下:

Agentic Cloud编排一大新品及更新如下:

Agentic Cloud治理四大新品及更新如下:

Agentic Cloud安全五大新品及更新如下:

Agentic Cloud记忆七大新品及更新如下:

Agentic Cloud数据平面十大新品及更新:

阿里云Agent Infrastructure已助MiniMax企业级Agent大规模落地。

有了这些产品及更新,未来一个开发者只需要给Agent一句自然语言指令,Agent就能自动完成从资源识别到应用部署的全流程,无需人工点击控制台或编写复杂脚本。

李飞飞认为,传统云产品的交互逻辑是为人设计的,用户看着控制台点击按钮,或者通过API编写代码调用。但Agent的工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。

传统云产品打开控制台,看到一堆菜单、配置项、仪表盘,这些视觉化信息对人很友好,但对Agent毫无意义。为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。

阿里云不是在云上加一层Agent接口,而是把云本身变成Agent能用的东西。这套改造的野心在于让云从“人的工具”变成“Agent的操作系统”。

二、平头哥首发真武M890,扔出128卡超节点算力王炸

芯片层,阿里云亮出了一张目前国内云厂商中独一份的王牌:覆盖算力、网络、存储的完整自研数据中心芯片矩阵

峰会现场,平头哥新一代训推一体AI芯片真武M890首次亮相。规格相当硬核:144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多种数据精度,可应用于高精度训练到超低精度推理的全场景。在低精度推理场景下,不仅能保证模型输出质量,还能显著降低单次推理的算力开销。

更值得关注的是基于真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0。这个超节点可让128张AI芯片组成一台计算机,P2P时延低于150ns,单柜带宽达到Pb/s级。

为什么要做这么大的超节点?因为Agentic时代,算力集群需要承载成千上万个Agent同时运行,每个Agent在一次任务中可能连续发起数十次模型调用,对通信时延和带宽的要求是指数级上升的。该超节点已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流模型。

平头哥还首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片,已服务中国电信、中国一汽、浦发银行等20多个行业的400多家客户。

加上自研的倚天系列CPU、磐脉智能网卡、镇岳存储主控芯片、ICN Switch互联芯片,平头哥的芯片版图已经从“单点突破”走到了“全面覆盖”。

三、Qwen3.7-Max来了,登顶Arena榜,胜任35小时长程任务

Qwen3.7-Max是阿里巴巴最新发布的旗舰大模型。

在三方机构Arena全球大模型盲测总榜中,它超过Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。在细分榜单上,数学排名第7、专家任务第9、编程任务第10,表现相当均衡。

比跑分更有说服力的,是一个堪称“极限测试”的实战案例。在模型训练时从未接触过的全新硬件平台——平头哥真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立进行了432次内核评估、1158次工具调用,完全自主地完成了编写、编译、性能分析与迭代改进的全流程。最终,它优化后的推理内核比SGLang Triton官方参考实现快了10倍。

没有人类干预,没有中间指导,35小时,从零到生产级。测试轨迹还显示,模型在独立运行超过30小时后仍发现了有效优化点,甚至主动发起了一次关键的架构重设计。这个案例展示的不是模型“回答问题”的能力,而是模型“自主完成复杂工程任务”的能力——这恰恰是Agent场景最核心的需求。

阿里巴巴通义大模型事业部负责人周靖人谈道:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。”

值得注意的是,近3个月内,千问旗舰模型已经连续迭代了3.5、3.6、3.7三个版本,保持着极高的发布节奏。阿里巴巴显然在刻意加速模型进化,以匹配Agent时代对模型能力的指数级增长需求。

四、百炼平台全面开放,智谱、Minimax、Kimi等顶尖模型首批上架

如果说芯片是地基、模型是引擎,那百炼推理平台就是Agent真正跑起来的“生产车间”。

阿里云在百炼平台上构建了大规模GPU资源集群,并通过一套完整的技术栈应对Agent场景的特殊挑战:并池调度将GPU资源统一调度提升利用率;上下文缓存消除多轮对话和长链路任务中的重复计算开销;吞吐弹性调度应对并发请求的波峰波谷;Agentic RL基于实际执行反馈让模型持续迭代。此外,百炼内建了安全治理能力——在Agent自主运行的语境下,一个24小时不间断执行任务的Agent如果没有边界约束,后果不可控。百炼的安全机制确保Agent始终在预设的权限范围内行动。

在生态策略上,百炼保持开放接入。峰会当天,阿里云宣布与月之暗面、Minimax、智谱、阶跃星辰、爱诗科技、生数科技等达成合作,GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百炼,并通过千问云官网全面售卖。目前百炼已提供150多款主流模型API。

百炼不仅提供阿里自研模型服务,同时面向头部AI厂商开放,为用户提供“一个入口、多模型可选”的一站式服务体验。目前百炼已推出按需、按时长的灵活计费模式,用户可通过统一SDK接口接入不同模型,实现灵活切换与高效迭代。据阿里最新财报,截至2026年3月,百炼平台该季度客户数量同比增长了8倍。

五、首发千问云,全面Skill和CLI化,对Agent更友好

千问云是阿里云成立17年来,首次在阿里云官网之外推出的全新产品官网。打开页面,突出的不是产品列表,也不是控制台,没有任何传统意义上的导航结构。首页只有一行字:

安装 Skills npx skills add QianWen-AI/qianwen-ai

这是一条Agent可读的prompt指令。阿里云将所有模型服务的核心能力封装为标准化的Skills和CLI工具,智能体可以直接解析这条指令,“学会”网站的全部能力,并根据需求自主调用。

过去十年,云的交互逻辑是“人登录控制台→选产品→配参数→调API”。这套流程对人类来说已经足够顺畅,但对Agent来说完全不可用。Agent不看网页,不点按钮,它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。

千问云Skills将模型选型、调用、认证配置、用量查询等完整链路能力封装,用户无需编写任何代码,Agent即可动态路由不同模型——自动用视觉模型处理图片,用生图模型生成图片,用视频生成模型创作视频。千问云CLI则可覆盖登录认证、模型查询、调用、用量查询和环境诊断等能力,直接通过脚本或命令行自动化完成所有模型服务的工作流。

基于千问云Skills和CLI,Agent还能实时拉取模型用量数据,自动分析趋势、识别异常,为用户提供成本优化建议。目前,千问云Skills和CLI均已在GitHub开源。付费模式上,千问云提供按量付费和Token Plan订阅两种模式,后者适用于高频AI编程和Agent场景,可显著降低Token成本。

结语:全球云巨头展开AI全栈竞赛

当云的主要消费者从人变成Agent,所有围绕人类设计的界面、流程和交互逻辑,都将被重写。

从芯片真武M890,到Agentic Cloud,到Qwen3.7-Max,到百炼平台,再到千问云……阿里云在2026年5月20日这一天,完成了一次从底层到入口的全链路重构。

放眼全球,这场竞赛刚刚进入深水区。谷歌以TPU+Gemini+GCP构筑闭环,亚马逊以Trainium+Nova+AWS正面迎战,微软手握Maia+ Copilot+Azure。而阿里云此次亮出的“芯-云-模型-推理”全栈体系,证明了中国云厂商有能力在同一张牌桌上竞争。

吴泳铭在财报电话会上把AI投入比作建设“训练工厂”和“推理工厂”。今天,这两座工厂已经开始全速运转。未来三年,阿里云的AI算力规模将比2022年增长十倍,是已经在执行的计划。

值得一提的是,阿里云选择了“开放”作为差异化路径——百炼平台接入150多款模型,千问云Skills和CLI全部开源,这既是生态策略,也是对Agent时代“没有一家模型能通吃一切”这一底层判断的回应。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10