红帽宣布推出llm-d社区,NVIDIA、Google Cloud为创始贡献者

新浪科技
May 27

  新浪科技讯 5月27日上午消息,全球开源解决方案提供商红帽公司近日宣布启动新开源项目llm-d,以满足生成式AI大规模推理需求。据悉,该项目与创始贡献者CoreWeave、Google Cloud、IBM Research和NVIDIA合作打造,能够利用突破性的大规模生成式AI推理技术,让大语言模型(LLM)推理云能够满足最苛刻的生产服务级目标(SLO)。

  据Gartner数据,“到2028年,随着市场的成熟,80%以上的数据中心工作负载加速器将专门部署用于推理,而不是训练用途。”随着推理模型日益复杂和规模不断扩大,其对资源需求的持续攀升限制了集中式推理的可行性,并有可能因成本过高和延迟过长而使AI创新陷入瓶颈。

  红帽及其行业合作伙伴正通过llm-d应对这一挑战,将先进的推理能力集成到现有的企业IT基础设施中。据悉,该统一平台使IT团队能够满足关键业务工作负载的各种服务需求,同时部署创新技术以最大限度地提高效率,并显著降低与高性能AI加速器相关的总体拥有成本(TCO)。

  目前,llm-d已获得了由生成式AI模型提供商、AI加速器先驱和主要AI云平台组成的联盟的支持。CoreWeave、Google Cloud、IBM Research和NVIDIA是该项目的创始贡献者,而AMD、思科、Hugging Face、英特尔、Lambda和Mistral AI是该项目的合作伙伴,这也表明,业界在构建大规模LLM服务的未来方面开展了深入合作。

  Google Cloud AI与计算基础设施副总裁兼总经理Mark Lohmeyer表示:“在企业大规模部署AI,并为用户创造价值的过程中,高效地AI推理至关重要。在我们进入推理的新时代之际,Google Cloud很荣幸能够作为llm-d项目的创始贡献者,在我们开源贡献传统的基础上再接再厉。”

  NVIDIA工程AI框架副总裁Ujval Kapasi表示:“llm-d项目是对开源AI生态系统的重要补充,体现了NVIDIA对合作推动生成式AI创新的支持。可扩展、高性能地推理是下一波生成式AI和代理式AI的关键。我们正在与红帽和其他支持合作伙伴合作,促进llm-d社区的参与和行业采用,利用NIXL等NVIDIA Dynamo创新帮助加速llm-d的发展。”(文猛)

海量资讯、精准解读,尽在新浪财经APP

责任编辑:杨赐

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10