
文/罗茜
"AI正在成为现代世界的基础设施。"
3月10日,在NVIDIA GTC 2026开幕前夕,英伟达创始人兼首席执行官黄仁勋在官方博客中写道,AI不再只是一个应用或单一模型,而正在像电力和互联网一样,成为新的基础设施。放眼全球,芯片工厂、计算机组装厂和AI工厂正在以前所未有的规模建设,价值数万亿美元。
资本市场与科技界关注的绝对重心,也从大模型本身,转向AI这一复杂系统的能源、芯片、基础设施、模型与应用。GTC 2026也因此定调——AI工厂(AI Factories)、智能体(Agentic AI)和推理(Inference),是核心议题。
AI即基建。作为与英伟达跨越三十年的紧密合作伙伴,联想集团站上了一个更值得被市场清楚看见的核心位置。
联想集团与英伟达的同盟,早已告别了"你供芯片、我造设备"的模式,而是升级到了"全栈AI战略共同体"。近年来,英伟达不断拓展算力的上限,联想则持续把这种能力转化为可交付、可运维、可复制的基础设施产品。前者决定技术边界,后者则决定这些技术能否真正进入企业与行业场景。
在此刻,当AI被黄仁勋定义为"人类历史上最大规模的基础设施建设",市场如梦初醒,为什么他此前会宣告,未来三年与联想集团的业务合作规模,将扩大至当前的四倍。因为,未来价值创造的重心,不只属于芯片与算力本身,也属于把算力变成系统、把系统变成交付、再把交付变成可复制能力的那一层。
因此,今年GTC大会真正重塑的,不只是英伟达的产品路线,更是整条AI产业链的分工想象。当Agentic AI爆发引发成本讨论,当AI从训练驱动转向推理驱动,当AI从模型竞赛转向基础设施竞赛,市场关注,联想集团将如何卡位这波万亿级的AI基建新浪潮,充分释放合作红利。
从工作站到AI云工厂
"当你和我第一次见面时,正值PC革命的起点。那是一次重大的平台迁移:从大型机和数据中心的客户端、服务器架构,转向PC。此后,我们又亲历了多次平台变革,从PC到互联网,从互联网到云计算,再从云计算到移动计算。而现在,一个全新的平台正在形成。"就在两个月多前,在参加联想集团举办的Tech World大会时,黄仁勋如此回顾双方的合作之旅。
到了GTC 2026前夜,这个"全新平台"的谜底呼之欲出:以AI为核心、以推理为驱动、以基础设施为底座、能够实时制造智能的新型计算平台。
按照黄仁勋的"五层蛋糕"理论,芯片之上、模型之下的"基础设施层",是一项涵盖供电、散热、网络互连与全栈调度的系统工程。联想集团卡位于此万亿级的AI基建赛道,是三十年工程壁垒演进的必然。
一开始,双方的合作建立在极其扎实,甚至显得有些枯燥的产业分工之上。早在2010年,联想集团在ThinkStation D20、S20、E20 等机型上采用了NVIDIA Quadro专业显卡。2015年,这种结合扩展到了ThinkPad P50、P70移动工作站领域。2019年,联想集团推出支持NVIDIA Quadro RTX和Tesla T4的ThinkStation P920 Rack,合作开始从专业图形与终端工作站,走向更接近数据中心和加速计算的系统形态。
联想集团在底层硬件架构上打磨出的工程默契,成为了日后承接更庞大的系统级并发算力的基础。随着AI爆发,在过去短短几年的时间内,联想集团完成了一场从"硬件通道"向"AI基建核心"的惊人进化。
在2024年3月的GTC大会上,联想集团与英伟达联合发布了面向企业和云场景的混合式 AI 解决方案,合作第一次明确从硬件协同,走向"企业与云的AI平台"。半年后的Tech World上,联想集团把合作从若干产品、若干项目,提升为一套覆盖个人、企业和公共AI的"混合式 AI"的总战略。
2025年的GTC大会,双方合作向智能体(Agentic AI)的方向推进,强调可规模化的智能体解决方案、企业工作流效率提升,以及商业生产率的改善。2026年初的Tech World,联想集团公开发布了AI云超级工厂,并明确提到将支持下一代Vera Rubin平台。"AI云超级工厂",已经不再是简单意义上的服务器或企业平台,而是明确面向全球AI云服务提供商的工厂化、系统化建设方案。
对于今年GTC大会,市场真正追问的,已经不是"有没有更强的芯片",而是"更强的芯片将怎样嵌入新一轮基础设施扩张"。这也解释了,联想集团与英伟达合作为何在今年显得格外重要, 双方开始围绕如何把AI作为基础设施建起来、交付出去并跑起来,形成更深的分工。而未来价值分配的一大部分,也将落在谁能把芯片和模型之间那层复杂、昂贵、重工程的系统搭起来。
GTC 2026把这个问题前所未有地摆到了台前。
Agentic AI的基建红利
"2026年可能成为Agentic AI元年", 华泰证券最新研报指出,AI推理正在上升为系统级基础设施。
近期受到大量关注的 Claude Code,以及开源agent框架Open Claw这类工具,正在改变人们使用软件的方式:AI不再只是聊天窗口里的助手,而开始更像一个能持续调用工具、编写代码、执行任务、维护会话和管理工作流的"数字员工"。
智能体爆发的落点,就在基础设施上。
一旦AI智能体从研究阶段走向大规模应用,算力需求就会从集中式模型训练,进一步扩展到海量实时推理与持续运行的agent网络。这意味着一个重要转折:AI的使用频率将从"偶尔调用"变成"全天候运行"。企业内部的每一个岗位、每一个业务流程,都可能对应一个长期在线的AI agent;而这些agent不只是请求一个模型回答问题,它们还要调用工具、访问上下文、保持状态、协同执行,甚至在多个系统之间来回穿梭。
McKinsey在2025年《State of AI》里写得很明确:Agentic AI正在加速扩散,但大多数组织仍停留在从试点走向规模化影响的过程中;Gartner的判断则更冷,到2027年底,超过40%的Agentic AI项目可能因成本高、商业价值不清或风控不足而被取消。
因此,市场一边追逐智能体,一边又迅速把问题从"能不能做"转向"值不值得做"。
对资本市场而言,这意味着系统能力、推理成本、部署效率和长期运行的可靠性,第一次同时成为投资问题。在GTC 2026前瞻中,瑞银(UBS)发布报告指出,本次大会的主题将继续从芯片性能比较,转向由"工作负载解耦(Disaggregation)"和"极致协同设计(Extreme co-design)"驱动的"系统级优化(System-level optimization)"。瑞银强调,市场将重点审视系统的可扩展性、网络领导力以及 AI资本开支的持续性。
也正是在这个节点上,黄仁勋开始反复把话题拉回到推理 token 成本。年初发布 Rubin 平台时,NVIDIA 官方给出的核心口径,已不再只是传统意义上的算力提升,而是推理token 经济学:相较Blackwell,Rubin平台可实现最高10倍的推理 Token 成本下降。NVIDIA开发者博客则进一步解释,对长上下文、以推理为主的工作负载,Vera Rubin NVL72可将每百万token的成本压到Blackwell NVL72的十分之一。
一旦把"tokenomics"当成新的观察坐标,联想集团与英伟达这段合作的意义更明确了:这是围绕推理成本、部署效率和系统交付重新组织分工。也就是说,把token成本打下来,靠的绝对不仅仅是Rubin芯片本身,而是承载它的物理系统——这正是联想攫取巨大商业红利的核心逻辑。
联想集团此前公开的吉瓦级AI工厂计划,恰恰是这一变化的最好注脚。联想官方对这套方案的定义,不是单台服务器,也不是单个企业平台,而是面向AI云厂商的预集成基础设施,核心卖点包括:统一的混合式 AI 基础设施、NVIDIA 加速计算平台,以及以time to first token(TTFT)为核心的部署效率。这里的评价维度已经不是"有没有合作产品",而是"能否更快跑出第一个 token,能否更快进入生产环境"。
已有市场报道指出:联想集团与英伟达这项合作的核心目标,正是帮助AI云服务提供商更快地将数据中心投入运行,把极其复杂的算力集群部署时间极度压缩至"短短几周"。 市场期待,本次GTC大会上,联想集团如何配合英伟达的新一代算力平台,通过极致的系统集成与部署效率,真正把Agentic AI的单Token成本打下来,吃下推理时代万亿美元的资本开支红利。
"最不能出错"的验证场
对资本市场来说,最有说服力的从来不是概念,而是场景;不是实验室里的性能跑分,而是现实的压力测试。
如果一套系统能够在赛事转播、实时数据处理、裁判辅助和全球运营调度中跑通,它才更有资格被视为真正的"基础设施能力"。正因如此,联想集团将在此次GTC上公布什么样的体育方案,值得市场期待。
联想集团与F1的合作,已不是简单的设备赞助,而是深入到其媒体与技术中心(Media & Technology Centre)的高性能计算环境中。据其官方披露,F1 依靠联想技术向全球超过8.2亿粉丝提供赛事内容;在一个典型比赛周末,F1 在赛道端 Event Technical Centre与英国Biggin Hill的媒体技术中心之间传输超过600TB的实时数据,后台则运行着180多个定制软件系统。
2026年1月,双方进一步将Neptune液冷技术部署到F1的HPC环境中,目标不仅是提升性能,也是在不显著增加能耗的前提下支撑更高密度的AI与数据负载。对联想集团而言,这类场景的价值,不在于"又服务了一个大客户",而在于它证明公司已经能够在实时转播、赛事运营和全球分发这种最不能掉链子的环境里,把基础设施能力做成连续运行的系统。
更令人瞩目的是FIFA。FIFA World Cup 2026将是史上最大规模的一届世界杯,预计48支球队、104 场比赛,横跨北美三国、16座城市。FIFA与联想集团已经披露的具体应用包括:Football AI Pro,即面向全部48支参赛队的生成式AI知识助手;用于半自动越位判定与转播呈现的AI-enabled 3D player avatars;以及新一代Referee View,通过AI稳定算法在实时画面中减少模糊和抖动。
面对世界顶级赛事,联想集团真正交出的,不只是几项"好看的AI功能",而是一种更有资本市场含义的能力组合:复杂系统集成、实时数据处理、全球化部署,以及在高风险环境下的持续运行。
回到"五层蛋糕"理论,芯片公司可以定义性能边界,模型公司可以定义应用想象,但真正把能力拉进现实世界、变成赛事、转播、运营和裁判系统的一套可运行方案,需要的却是另一种能力:把算力、网络、散热、软件、设备与服务组织成一个不会在关键时刻失灵的系统。F1和FIFA之所以关键,不是因为它们"有名",而是因为它们把联想集团的交付能力放到了最公开、最苛刻、最难容错的环境里。
对于联想集团而言,GTC 2026是一场硬核实力的自证。市场期待,联想集团能通过这些"最不能出错"的极端场景实战成绩,向全球投资者毫无保留地证明,这些生产级AI场景,是该企业在AI基础设施产业链中位置上移的证据。