紅帽宣佈推出llm-d社區，NVIDIA、Google Cloud為創始貢獻者

　　新浪科技訊 5月27日上午消息，全球開源解決方案提供商紅帽公司近日宣佈啓動新開源項目llm-d，以滿足生成式AI大規模推理需求。據悉，該項目與創始貢獻者CoreWeave、Google Cloud、IBM Research和NVIDIA合作打造，能夠利用突破性的大規模生成式AI推理技術，讓大語言模型（LLM）推理雲能夠滿足最苛刻的生產服務級目標（SLO）。

　　據Gartner數據，「到2028年，隨着市場的成熟，80%以上的數據中心工作負載加速器將專門部署用於推理，而不是訓練用途。」隨着推理模型日益複雜和規模不斷擴大，其對資源需求的持續攀升限制了集中式推理的可行性，並有可能因成本過高和延遲過長而使AI創新陷入瓶頸。

　　紅帽及其行業合作伙伴正通過llm-d應對這一挑戰，將先進的推理能力集成到現有的企業IT基礎設施中。據悉，該統一平台使IT團隊能夠滿足關鍵業務工作負載的各種服務需求，同時部署創新技術以最大限度地提高效率，並顯著降低與高性能AI加速器相關的總體擁有成本（TCO）。

　　目前，llm-d已獲得了由生成式AI模型提供商、AI加速器先驅和主要AI雲平台組成的聯盟的支持。CoreWeave、Google Cloud、IBM Research和NVIDIA是該項目的創始貢獻者，而AMD、思科、Hugging Face、英特爾、Lambda和Mistral AI是該項目的合作伙伴，這也表明，業界在構建大規模LLM服務的未來方面開展了深入合作。

　　Google Cloud AI與計算基礎設施副總裁兼總經理Mark Lohmeyer表示：「在企業大規模部署AI，並為用戶創造價值的過程中，高效地AI推理至關重要。在我們進入推理的新時代之際，Google Cloud很榮幸能夠作為llm-d項目的創始貢獻者，在我們開源貢獻傳統的基礎上再接再厲。」

　　NVIDIA工程AI框架副總裁Ujval Kapasi表示：「llm-d項目是對開源AI生態系統的重要補充，體現了NVIDIA對合作推動生成式AI創新的支持。可擴展、高性能地推理是下一波生成式AI和代理式AI的關鍵。我們正在與紅帽和其他支持合作伙伴合作，促進llm-d社區的參與和行業採用，利用NIXL等NVIDIA Dynamo創新幫助加速llm-d的發展。」（文猛）

海量資訊、精準解讀，盡在新浪財經APP

責任編輯：楊賜

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

紅帽宣佈推出llm-d社區，NVIDIA、Google Cloud為創始貢獻者

熱議股票