6月24日,博通盤前直線拉升,現升逾3%!OpenAI與博通聯合發布人工智能芯片,旨在更快、更經濟地運行模型。
OpenAI 和博通今天發布了 Jalapeño,這是 OpenAI 的首款智能處理器:一款圍繞 OpenAI 對 LLM 推理未來的願景而設計的加速器,也是兩家公司正在共同構建的多代計算平台中的首款 AI 加速器,旨在使先進的 AI 更快、更可靠,並讓更多人更容易獲得。
博通總裁兼首席執行官 Hock Tan 和半導體解決方案總裁 Charlie Kawwas 將 Jalapeño 送給了 OpenAI 首席執行官 Sam Altman 和總裁 Greg Brockman,這標誌着 OpenAI 在構建其模型和產品背後的完整堆棧的戰略中邁出了重要一步。
OpenAI 基於其對機器學習模型 (LLM) 基本原理的深刻理解,並結合其模型、內核、服務系統和產品需求的路線圖,從零開始設計了這款芯片。OpenAI 與合作伙伴 Broadcom 和 Celestica 攜手,通過芯片實現、電路板和機架系統集成、高性能網絡以及可擴展的生產系統,助力該平台實現產業化。Jalapeño 芯片的設計兼顧靈活性,能夠與所有 LLM 兼容,這得益於 OpenAI 對當前及未來全行業 AI 模型推理需求的深刻洞察。Jalapeño 芯片的工程樣品已在實驗室中以生產目標頻率和功耗運行機器學習工作負載,包括 GPT-5.3-Codex-Spark。
OpenAI仍在評估最終性能,但早期測試表明,Jalapeño的每瓦性能將顯著優於目前最先進的技術。一份詳細的性能技術報告將在未來幾個月內發布。該架構減少了數據傳輸,並平衡了計算、內存和網絡資源,從而使實際利用率更接近理論峯值性能。博通的芯片實現和網絡技術,包括Tomahawk網絡芯片,助力該平台實現大規模量產。
OpenAI總裁兼聯合創始人格雷格·布羅克曼表示:「世界正在邁向計算驅動型經濟。Jalapeño是我們長期全棧基礎設施戰略的一部分,旨在提升計算能力,從而打造速度更快、更可靠、更經濟實惠的人工智能,讓個人和企業都能從中受益,並用於解決更重要的問題。通過自主設計更多技術棧,我們可以更高效地提供更強大的智能服務,並不斷推動先進人工智能走向更廣泛的應用。」
「Jalapeño 從底層架構開始就專為 LLM 推理而設計,並融入了我們與 OpenAI 研究人員緊密合作的深入見解,」OpenAI 硬件項目負責人 Richard Ho 表示。「我們圍繞內核、內存移動、網絡和服務模式等對前沿 AI 模型至關重要的方面優化了架構。根據早期測試,Jalapeño 能夠高效地執行我們最重要的工作負載,並接近硬件的理論極限。」
博通公司總裁兼首席執行官陳福表示:「我們與OpenAI的合作體現了我們對未來十年人工智能所需物理基礎設施規模化發展的根本承諾。這僅僅是一個多代路線圖的開端。通過與OpenAI直接合作開發我們業界領先的芯片,我們將與微軟和其他合作伙伴攜手,從2026年開始部署千兆瓦級數據中心。」
旨在成為LLM的最佳推理平台
Jalapeño 是一個專為現代 LLM 推理而設計的全新方案,並非基於早期 AI 工作負載改造的通用加速器。它借鑑了 OpenAI 日常運行的系統,包括 ChatGPT、Codex、API 以及未來的智能體產品,同時也面向當前及未來業界的 LLM 應用。其目標是將當今領先的 AI 加速器的性能和吞吐量與接近最快專用推理系統的延遲相結合,從而使 Jalapeño 非常適合大規模交互式 LLM 產品。
歷時九個月完成流片,藉助 OpenAI 模型加速完成
Jalapeño 從最初設計到最終流片僅用了九個月時間便完成了聯合開發,其定製的 AI 加速器項目代表了高性能先進半導體領域 ASIC 開發周期可能達到的最快水平。這一速度得益於與 OpenAI 工程團隊的深度軟硬件協同開發、博通的芯片實現專長,以及利用 OpenAI 模型加速部分設計和優化流程。
提供給用戶的模型也有助於改進運行未來模型的基礎設施。如果人工智能能夠幫助工程師更快地設計出更好的芯片,就能降低整個行業的計算成本,並有助於普及先進的人工智能技術。
與合作伙伴共同構建多代平台
Jalapeño 是一個多代計算平台的第一步,該平台旨在到 2026 年底進行初始部署,並在未來幾年內不斷擴展,它將 OpenAI 設計的加速器與 Broadcom 的芯片實現、網絡和連接技術以及 Celestica 的電路板、機架和系統專業知識相結合。