GTC 2026前夜:AI即基建,联想与英伟达三十年合作站上哪一层

格隆汇
Yesterday

文/罗茜

"AI正在成为现代世界的基础设施。"

3月10日,在NVIDIA GTC 2026开幕前夕,英伟达创始人兼首席执行官黄仁勋在官方博客中写道,AI不再只是一个应用或单一模型,而正在像电力和互联网一样,成为新的基础设施。放眼全球,芯片工厂、计算机组装厂和AI工厂正在以前所未有的规模建设,价值数万亿美元。

资本市场与科技界关注的绝对重心,也从大模型本身,转向AI这一复杂系统的能源、芯片、基础设施、模型与应用。GTC 2026也因此定调——AI工厂(AI Factories)、智能体(Agentic AI)和推理(Inference),是核心议题。

AI即基建。作为与英伟达跨越三十年的紧密合作伙伴,联想集团站上了一个更值得被市场清楚看见的核心位置。

联想集团与英伟达的同盟,早已告别了"你供芯片、我造设备"的模式,而是升级到了"全栈AI战略共同体"。近年来,英伟达不断拓展算力的上限,联想则持续把这种能力转化为可交付、可运维、可复制的基础设施产品。前者决定技术边界,后者则决定这些技术能否真正进入企业与行业场景。

在此刻,当AI被黄仁勋定义为"人类历史上最大规模的基础设施建设",市场如梦初醒,为什么他此前会宣告,未来三年与联想集团的业务合作规模,将扩大至当前的四倍。因为,未来价值创造的重心,不只属于芯片与算力本身,也属于把算力变成系统、把系统变成交付、再把交付变成可复制能力的那一层。

因此,今年GTC大会真正重塑的,不只是英伟达的产品路线,更是整条AI产业链的分工想象。当Agentic AI爆发引发成本讨论,当AI从训练驱动转向推理驱动,当AI从模型竞赛转向基础设施竞赛,市场关注,联想集团将如何卡位这波万亿级的AI基建新浪潮,充分释放合作红利。

从工作站到AI云工厂

"当你和我第一次见面时,正值PC革命的起点。那是一次重大的平台迁移:从大型机和数据中心的客户端、服务器架构,转向PC。此后,我们又亲历了多次平台变革,从PC到互联网,从互联网到云计算,再从云计算到移动计算。而现在,一个全新的平台正在形成。"就在两个月多前,在参加联想集团举办的Tech World大会时,黄仁勋如此回顾双方的合作之旅。

到了GTC 2026前夜,这个"全新平台"的谜底呼之欲出:以AI为核心、以推理为驱动、以基础设施为底座、能够实时制造智能的新型计算平台。

按照黄仁勋的"五层蛋糕"理论,芯片之上、模型之下的"基础设施层",是一项涵盖供电、散热、网络互连与全栈调度的系统工程。联想集团卡位于此万亿级的AI基建赛道,是三十年工程壁垒演进的必然。

一开始,双方的合作建立在极其扎实,甚至显得有些枯燥的产业分工之上。早在2010年,联想集团在ThinkStation D20、S20、E20 等机型上采用了NVIDIA Quadro专业显卡。2015年,这种结合扩展到了ThinkPad P50、P70移动工作站领域。2019年,联想集团推出支持NVIDIA Quadro RTX和Tesla T4的ThinkStation P920 Rack,合作开始从专业图形与终端工作站,走向更接近数据中心和加速计算的系统形态。

联想集团在底层硬件架构上打磨出的工程默契,成为了日后承接更庞大的系统级并发算力的基础。随着AI爆发,在过去短短几年的时间内,联想集团完成了一场从"硬件通道"向"AI基建核心"的惊人进化。

在2024年3月的GTC大会上,联想集团与英伟达联合发布了面向企业和云场景的混合式 AI 解决方案,合作第一次明确从硬件协同,走向"企业与云的AI平台"。半年后的Tech World上,联想集团把合作从若干产品、若干项目,提升为一套覆盖个人、企业和公共AI的"混合式 AI"的总战略。

2025年的GTC大会,双方合作向智能体(Agentic AI)的方向推进,强调可规模化的智能体解决方案、企业工作流效率提升,以及商业生产率的改善。2026年初的Tech World,联想集团公开发布了AI云超级工厂,并明确提到将支持下一代Vera Rubin平台。"AI云超级工厂",已经不再是简单意义上的服务器或企业平台,而是明确面向全球AI云服务提供商的工厂化、系统化建设方案。

对于今年GTC大会,市场真正追问的,已经不是"有没有更强的芯片",而是"更强的芯片将怎样嵌入新一轮基础设施扩张"。这也解释了,联想集团与英伟达合作为何在今年显得格外重要, 双方开始围绕如何把AI作为基础设施建起来、交付出去并跑起来,形成更深的分工。而未来价值分配的一大部分,也将落在谁能把芯片和模型之间那层复杂、昂贵、重工程的系统搭起来。

GTC 2026把这个问题前所未有地摆到了台前。

Agentic AI的基建红利

"2026年可能成为Agentic AI元年", 华泰证券最新研报指出,AI推理正在上升为系统级基础设施。

近期受到大量关注的 Claude Code,以及开源agent框架Open Claw这类工具,正在改变人们使用软件的方式:AI不再只是聊天窗口里的助手,而开始更像一个能持续调用工具、编写代码、执行任务、维护会话和管理工作流的"数字员工"。

智能体爆发的落点,就在基础设施上。

一旦AI智能体从研究阶段走向大规模应用,算力需求就会从集中式模型训练,进一步扩展到海量实时推理与持续运行的agent网络。这意味着一个重要转折:AI的使用频率将从"偶尔调用"变成"全天候运行"。企业内部的每一个岗位、每一个业务流程,都可能对应一个长期在线的AI agent;而这些agent不只是请求一个模型回答问题,它们还要调用工具、访问上下文、保持状态、协同执行,甚至在多个系统之间来回穿梭。

McKinsey在2025年《State of AI》里写得很明确:Agentic AI正在加速扩散,但大多数组织仍停留在从试点走向规模化影响的过程中;Gartner的判断则更冷,到2027年底,超过40%的Agentic AI项目可能因成本高、商业价值不清或风控不足而被取消。

因此,市场一边追逐智能体,一边又迅速把问题从"能不能做"转向"值不值得做"。

对资本市场而言,这意味着系统能力、推理成本、部署效率和长期运行的可靠性,第一次同时成为投资问题。在GTC 2026前瞻中,瑞银(UBS)发布报告指出,本次大会的主题将继续从芯片性能比较,转向由"工作负载解耦(Disaggregation)"和"极致协同设计(Extreme co-design)"驱动的"系统级优化(System-level optimization)"。瑞银强调,市场将重点审视系统的可扩展性、网络领导力以及 AI资本开支的持续性。

也正是在这个节点上,黄仁勋开始反复把话题拉回到推理 token 成本。年初发布 Rubin 平台时,NVIDIA 官方给出的核心口径,已不再只是传统意义上的算力提升,而是推理token 经济学:相较Blackwell,Rubin平台可实现最高10倍的推理 Token 成本下降。NVIDIA开发者博客则进一步解释,对长上下文、以推理为主的工作负载,Vera Rubin NVL72可将每百万token的成本压到Blackwell NVL72的十分之一。

一旦把"tokenomics"当成新的观察坐标,联想集团与英伟达这段合作的意义更明确了:这是围绕推理成本、部署效率和系统交付重新组织分工。也就是说,把token成本打下来,靠的绝对不仅仅是Rubin芯片本身,而是承载它的物理系统——这正是联想攫取巨大商业红利的核心逻辑。

联想集团此前公开的吉瓦级AI工厂计划,恰恰是这一变化的最好注脚。联想官方对这套方案的定义,不是单台服务器,也不是单个企业平台,而是面向AI云厂商的预集成基础设施,核心卖点包括:统一的混合式 AI 基础设施、NVIDIA 加速计算平台,以及以time to first token(TTFT)为核心的部署效率。这里的评价维度已经不是"有没有合作产品",而是"能否更快跑出第一个 token,能否更快进入生产环境"。

已有市场报道指出:联想集团与英伟达这项合作的核心目标,正是帮助AI云服务提供商更快地将数据中心投入运行,把极其复杂的算力集群部署时间极度压缩至"短短几周"。 市场期待,本次GTC大会上,联想集团如何配合英伟达的新一代算力平台,通过极致的系统集成与部署效率,真正把Agentic AI的单Token成本打下来,吃下推理时代万亿美元的资本开支红利。

"最不能出错"的验证场

对资本市场来说,最有说服力的从来不是概念,而是场景;不是实验室里的性能跑分,而是现实的压力测试。

如果一套系统能够在赛事转播、实时数据处理、裁判辅助和全球运营调度中跑通,它才更有资格被视为真正的"基础设施能力"。正因如此,联想集团将在此次GTC上公布什么样的体育方案,值得市场期待。

联想集团与F1的合作,已不是简单的设备赞助,而是深入到其媒体与技术中心(Media & Technology Centre)的高性能计算环境中。据其官方披露,F1 依靠联想技术向全球超过8.2亿粉丝提供赛事内容;在一个典型比赛周末,F1 在赛道端 Event Technical Centre与英国Biggin Hill的媒体技术中心之间传输超过600TB的实时数据,后台则运行着180多个定制软件系统。

2026年1月,双方进一步将Neptune液冷技术部署到F1的HPC环境中,目标不仅是提升性能,也是在不显著增加能耗的前提下支撑更高密度的AI与数据负载。对联想集团而言,这类场景的价值,不在于"又服务了一个大客户",而在于它证明公司已经能够在实时转播、赛事运营和全球分发这种最不能掉链子的环境里,把基础设施能力做成连续运行的系统。

更令人瞩目的是FIFA。FIFA World Cup 2026将是史上最大规模的一届世界杯,预计48支球队、104 场比赛,横跨北美三国、16座城市。FIFA与联想集团已经披露的具体应用包括:Football AI Pro,即面向全部48支参赛队的生成式AI知识助手;用于半自动越位判定与转播呈现的AI-enabled 3D player avatars;以及新一代Referee View,通过AI稳定算法在实时画面中减少模糊和抖动。

面对世界顶级赛事,联想集团真正交出的,不只是几项"好看的AI功能",而是一种更有资本市场含义的能力组合:复杂系统集成、实时数据处理、全球化部署,以及在高风险环境下的持续运行。

回到"五层蛋糕"理论,芯片公司可以定义性能边界,模型公司可以定义应用想象,但真正把能力拉进现实世界、变成赛事、转播、运营和裁判系统的一套可运行方案,需要的却是另一种能力:把算力、网络、散热、软件、设备与服务组织成一个不会在关键时刻失灵的系统。F1和FIFA之所以关键,不是因为它们"有名",而是因为它们把联想集团的交付能力放到了最公开、最苛刻、最难容错的环境里。

对于联想集团而言,GTC 2026是一场硬核实力的自证。市场期待,联想集团能通过这些"最不能出错"的极端场景实战成绩,向全球投资者毫无保留地证明,这些生产级AI场景,是该企业在AI基础设施产业链中位置上移的证据。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10