谷歌一口气推出两款TPU,首度拆分训练与推理芯片,企业AI智能体全面铺开

华尔街见闻
Apr 22

谷歌云发布两款第八代TPU芯片:8T主攻训练、8I面向推理场景,核心指向降低推理成本与支撑AI智能体规模化,预计于今年晚些时候上市供应;并推出Gemini企业级智能体平台,补齐记忆与协作短板,切入自动化入口。在推理需求爆发背景下,谷歌正以算力重构+应用层卡位,正面冲击英伟达与OpenAI主导格局。

Alphabet旗下谷歌云在年度开发者大会上密集出牌,同步推出新一代自研芯片与企业级AI智能体工具,在硬件和软件两条战线上同时向英伟达、OpenAI及Anthropic发起挑战。

当地时间周三,谷歌云在拉斯维加斯举行的Google Cloud Next 2026大会上,发布了第八代张量处理器(TPU)的两款新品:专为AI模型训练设计的TPU 8T,以及专为推理(inference)阶段优化的TPU 8i,预计于今年晚些时候上市供应这是谷歌首次将训练与推理任务拆分至独立芯片,标志着其AI硬件战略的重大转向。

与此同时,谷歌还推出了Gemini Enterprise Agent Platform等一系列AI智能体开发工具,直接瞄准企业自动化市场。

新芯片的发布正值AI推理需求急速扩张之际。谷歌云计算与AI基础设施副总裁Mark Lohmeyer表示:"关键在于如何以最低的每笔交易成本实现最低的响应延迟。交易量正在大幅攀升,而每笔交易的成本必须大幅下降,才能实现规模化。"两款新芯片将于今年晚些时候正式上线。

训练与推理分离,芯片性能大幅跃升

谷歌此次将第八代TPU拆分为两款独立产品,是对AI工作负载日益分化趋势的直接回应。

谷歌高级副总裁兼AI与基础设施首席技术官Amin Vahdat在博客中写道:"随着AI智能体的兴起,我们判断业界将受益于针对训练和推理各自需求专门优化的芯片。"

TPU 8t专为AI模型训练优化,号称能够"将前沿模型开发周期从数月压缩至数周"。

在性能层面,TPU 8t的每瓦性能较上一代提升124%,TPU 8i则提升117%。与去年11月发布的第七代Ironwood TPU相比,TPU 8t在同等价格下性能提升2.8倍,TPU 8i的性能则提升80%。

训练芯片TPU 8t最多可将9600块芯片组合成一套系统,谷歌表示,在部署如此大规模系统时,电力已成为数据中心的核心制约因素,更高的能效比因此至关重要。

TPU 8i则主要面向推理场景,适用于运行AI模型及处理AI智能体任务。其架构设计重点在于大容量片上存储。每块芯片集成384MB的静态随机存取存储器(SRAM),是上一代Ironwood的三倍。

两款芯片均计划于2026年晚些时候正式对外供应。

Alphabet首席执行官桑达尔·皮查伊在博客中表示,这一架构旨在"以具有成本效益的方式,提供同时运行数百万个智能体所需的大规模吞吐量和低延迟"。片上存储的增加意味着芯片无需频繁从外部调取数据,对于需要多步骤推理的AI任务尤为关键。

AI智能体平台全面铺开,直指OpenAI与Anthropic

在软件层面,谷歌此次发布了一套完整的企业AI智能体工具链,正面迎战OpenAI和Anthropic在企业市场的布局。

据彭博报道,多位初创公司创始人表示,硅谷工程师在AI编程工具的选择上通常在Anthropic的Claude Code与OpenAI的Codex之间切换,谷歌往往不在考虑之列——这一现状令谷歌高层深感忧虑。

谷歌云CEO Thomas Kurian在博客中表示:"这不是提供可拼凑在一起的单项服务,而是提供一个全面的创新基础骨架。"

新推出的Gemini Enterprise Agent Platform新增了Memory Bank和Memory Profile功能,帮助智能体记住与用户的历史交互,弥补早期AI工具的记忆短板;Agent Simulation功能则允许开发者在上线前对工具进行更充分的测试。

谷歌还推出了协作平台Projects,整合来自Workspace、微软OneDrive及企业内部聊天工具的信息,为智能体提供必要的上下文支持。此外,谷歌还发布了面向普通员工的Gemini Enterprise应用,定位为"每位员工的AI前台",用户无需编写任何代码即可创建智能体。

TPU采用加速,英伟达合作并行推进

尽管谷歌在自研芯片上持续加码,但其与英伟达的合作关系并未中断。

Mark Lohmeyer表示,谷歌计划成为今年下半年英伟达新一代芯片设计的首批部署方之一,同时将继续为希望使用英伟达系统的客户提供相关服务。

与此同时,谷歌TPU的商业采用正在提速。

对冲基金Citadel Securities已基于谷歌TPU构建量化研究软件,美国能源部旗下全部17个国家实验室均在使用基于TPU构建的AI协作科学家软件。Meta已与谷歌签署一项多年期、数十亿美元的TPU使用协议,AI新贵Anthropic也已承诺使用数吉瓦级别的谷歌TPU算力。

DA Davidson分析师去年9月估计,TPU业务与谷歌DeepMind AI部门合计价值约9000亿美元。

值得注意的是,谷歌并未将新芯片的性能与英伟达产品直接对比。英伟达方面,其即将推出的新品线将整合其以200亿美元收购Groq所获得的技术,专门针对超低延迟推理场景。

英伟达首席执行官黄仁勋此前表示,超过20%的AI工作负载可能最适合由此类芯片处理。Groq由一批前谷歌工程师于2016年创立。

为进一步扩大TPU的可及性,谷歌还在测试将TPU部署至客户自有数据中心的方案,并推进与第三方软件工具的兼容性。不过,芯片供应瓶颈以及AI模型快速迭代与多年期芯片开发周期之间的错位,仍是谷歌扩大规模过程中需要应对的主要不确定因素。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10