对话联想基础设施业务群黄山、周韬:单纯算力中心面临生存危机,AI工厂如何重构商业闭环

凤凰网科技
13 hours ago

作者/于雷

编辑/刘毓坤

在2025年,中国AI产业正经历从狂热的“百模大战”向冷静的“应用落地”转型的关键周期。12月5日,在北京举办的2025联想异构智算产业联盟高峰论坛上,联想集团试图通过发布“AI工厂”解决方案、核武级服务器以及全新的行业标准。在算力不再稀缺的当下,如何解决效率与商业价值的错配? 联想中国基础设施业务群战略管理总监黄山与服务器事业部总经理周韬在接受媒体专访时,不仅详解了硬件架构的激进演进,更直言不讳地指出了当前大模型商业化面临的挑战与机遇。

算力中心的终结与“AI工厂”的崛起

在当前的AI浪潮中,单纯的算力堆砌已无法满足复杂的产业需求。联想在此次峰会上正式提出的“AI工厂”概念,并非简单的营销词汇更迭,而是对算力基础设施商业模式的一次重构。

针对凤凰网科技提出的关键问题——“算力中心到AI工厂的转变是降低成本的关键,除了技术整合,联想在商业模式上有什么创新规划真正帮助中小企业降低门槛?” 联想方面给出了极具战略深度的回应。

联想中国基础设施业务群战略管理总监黄山

黄山在回答中直指核心痛点,他认为单纯的算力中心如果不能进化,将面临严峻的生存危机。“从单纯看算力中心和今天我们提出更大的整体方案AI工厂,这个差距我以前只能在算力中心板块里,我就没有能把其他板块,比如数据板块、生产管理板块、应用反馈体系到数据飞轮这样的板块,这都是业务。”

他进一步强调,这种差距将导致竞争层面的不对等:“这些业务如果有生态形成了联动以后,我只做数据中心,我就被形成降维打击了。怎么叫降维打击?当赋能用户的时候,给AI工厂只给计算中心。首先方案的完整性不如别人。第二个,因为你没有跟其他的业务板块协同,你的效率肯定不如一个完整的AI工厂,最终的效率一定是不行的。”

联想的商业创新在于“补足”客户的能力短板。黄山解释道:“我们的客户有的有自己的数据,有自己的设计能力,但是没有生产能力。有的客户也有生产能力,但没有生产管理能力,有的客户出来的应用如何做迭代,他没有成周期升级维护的能力。这些能力我们自己拥有了全面覆盖之后,我们要去补足我们的客户。” 这意味着联想正从单一的硬件供应商,转型为全栈能力的输送者,通过提供从咨询、数据治理到AI生产管理的一整套能力,降低中小企业自建团队和基础设施的高昂门槛。

拒绝“黑盒”:以标准化打破效率困境

除了商业模式的升级,行业标准的缺失是此次联想发力的另一重点。黄山指出,目前市场存在一个普遍困难:“做AI训练和推理到底怎么样叫作有效率?这件事没标准。” 许多企业建立了数据中心,“但是数据中心训练这个大模型的效率好不好,从能源上、时间上、投入产出上,没有标准。”

为此,联想联合标准院及多家机构发布了训推一体化规范。黄山表示:“我们这个服务能做到一个什么样的水平把它量化出来,把它量化出来之后,我们可以设立一个标杆……这样客户就明白了,什么叫好的训推服务的投入产出指标、效率指标,如何去评测它。” 这一举措旨在消除算力服务市场的信息不对称,让客户的每一分投入都看得见产出。

“核武级”军备竞赛:应对GPU架构的极速迭代

在硬件层面,显卡功耗突破1000瓦后的硬件焦虑正在倒逼服务器设计的变革。联想此次发布的联想问天WA8080a G5被冠以“核武级”的称号,其背后是工程师对摩尔定律失效的焦虑与应对。

联想中国基础设施业务群服务器事业部总经理周韬

联想中国基础设施业务群服务器事业部总经理周韬坦言研发面临的巨大挑战:“GPU技术的发展远远已经超过了之前CPU、算力的发展……我们当定下一个架构的时候,很可能你发现过了一年,这个架构已经不能支持新的发展了,这个时候我们根本无法去预测未来一年、两年这个机器的形态和架构。”

为了应对这种不确定性,联想采取了模块化设计策略。周韬透露:“我们把机箱加到了10U,从我们现在的评估来看,10U基本上能够支持到超过1000瓦的单GPU……我们相当于放了一个非常大的余量。” 这种被称为“1+3+N”的架构设计,允许CPU、GPU和背板模块化组合,“新的GPU来,我们按照现在的时间,大概很短的时间,我们可以去适配一个新的模组。” 这种设计旨在保护客户的长期投资,避免因GPU快速迭代而导致整机报废。

万全4.0:紧跟DeepSeek与长序列趋势

软件定义算力是发挥硬件性能的关键。联想发布的万全异构智算平台4.0,针对2024年涌现的新技术趋势进行了针对性优化。

黄山在专访中特别提到了DeepSeek带来的行业变革:“DeepSeek出来以后,确实非常突破了,它公开了很多模型训练中对算力优化的方式方法,有些是颠覆性的。” 联想已将这些方法实现在推理中,完成了从2.0到3.0的演进。

而在4.0版本中,联想重点解决了长序列带来的并行策略挑战。“现在所有的模型标杆是128K的序列……Kimi这种已经做到20万字了,这个事情导致你要为这种大的负载进行一种并行策略的优化。” 此外,针对RoCE网络在大规模集群中带宽衰减的问题,联想也实现了技术突破,“RoCE网络这里面存在一个问题,超过四台机器,用RoCE网络来连,如果你不做负载均衡,它的带宽就可以掉……这件事情用传统负载均衡的方法解决不了,所以我们创新了一种可以解决的办法。”

商业真相:谁在真正为AI买单?

尽管技术突飞猛进,但AI应用的商业化落地依然充满挑战。周韬在采访中分享了一个冷静的观察,引发了关于“只有10%的客户愿意为模型付费吗”的深思。

周韬表示:“这些模型现在垂域或者在这些领域上面,真正能够形成明显有收入的这种应用,相对还是比较少的……更多还是在开放一个免费的应用。” 他将其与移动互联网时代对比,认为目前尚未达到大规模客户愿意付费的成熟阶段:“今天的移动互联网已经到了大规模客户愿意去付费的年代,爱奇艺我愿意成为一个付费会员,当大家都愿意成为付费会员的时候,就说明这个生态已经足够成熟了。”

这一观点虽然不代表联想官方对大模型市场的整体定性,但却揭示了基础设施提供商视角的真实市场温差——在硬件军备竞赛的背后,应用侧的造血能力仍需时间培育。

结语

从“堆硬件”到“优服务”,从无序竞争到标准化确立,联想在2025年的动作表明,AI算力产业正在进入深水区。联想试图通过“AI工厂”这一全栈模式,将复杂的异构算力封装成可度量、可交付、可盈利的标准化服务。对于行业而言,这不仅是技术架构的升级,更是一场关于生产效率与商业模式的深度变革。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10