紅帽宣佈推出llm-d社區,NVIDIA、Google Cloud為創始貢獻者

新浪科技
05/27

  新浪科技訊 5月27日上午消息,全球開源解決方案提供商紅帽公司近日宣佈啓動新開源項目llm-d,以滿足生成式AI大規模推理需求。據悉,該項目與創始貢獻者CoreWeave、Google Cloud、IBM Research和NVIDIA合作打造,能夠利用突破性的大規模生成式AI推理技術,讓大語言模型(LLM)推理雲能夠滿足最苛刻的生產服務級目標(SLO)。

  據Gartner數據,“到2028年,隨着市場的成熟,80%以上的數據中心工作負載加速器將專門部署用於推理,而不是訓練用途。”隨着推理模型日益複雜和規模不斷擴大,其對資源需求的持續攀升限制了集中式推理的可行性,並有可能因成本過高和延遲過長而使AI創新陷入瓶頸。

  紅帽及其行業合作伙伴正通過llm-d應對這一挑戰,將先進的推理能力集成到現有的企業IT基礎設施中。據悉,該統一平臺使IT團隊能夠滿足關鍵業務工作負載的各種服務需求,同時部署創新技術以最大限度地提高效率,並顯著降低與高性能AI加速器相關的總體擁有成本(TCO)。

  目前,llm-d已獲得了由生成式AI模型提供商、AI加速器先驅和主要AI雲平臺組成的聯盟的支持。CoreWeave、Google Cloud、IBM Research和NVIDIA是該項目的創始貢獻者,而AMD、思科、Hugging Face、英特爾、Lambda和Mistral AI是該項目的合作伙伴,這也表明,業界在構建大規模LLM服務的未來方面開展了深入合作。

  Google Cloud AI與計算基礎設施副總裁兼總經理Mark Lohmeyer表示:“在企業大規模部署AI,併爲用戶創造價值的過程中,高效地AI推理至關重要。在我們進入推理的新時代之際,Google Cloud很榮幸能夠作爲llm-d項目的創始貢獻者,在我們開源貢獻傳統的基礎上再接再厲。”

  NVIDIA工程AI框架副總裁Ujval Kapasi表示:“llm-d項目是對開源AI生態系統的重要補充,體現了NVIDIA對合作推動生成式AI創新的支持。可擴展、高性能地推理是下一波生成式AI和代理式AI的關鍵。我們正在與紅帽和其他支持合作伙伴合作,促進llm-d社區的參與和行業採用,利用NIXL等NVIDIA Dynamo創新幫助加速llm-d的發展。”(文猛)

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:楊賜

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10