OpenAI只用了9個月造出一顆芯片,行業平均要3年,英偉達真的開始慌了

智元宇宙
06/25

9個月。

從一張白紙到芯片出片,OpenAI只花了9個月。這個行業正常走路,要兩到三年。

這顆讓全行業側目的東西叫Jalapeño——墨西哥辣椒裏辣度最溫柔的一個品種。名字起得謙虛,事情做得一點都不客氣。

6月24日,博通CEO陳福陽親手把工程樣片遞到了Sam Altman手上。OpenAI,正式拿到了芯片俱樂部的入場券。

真正讓業內坐不住的,不是這顆芯片跑分多高——實際上詳細的技術報告還沒公開。而是另外兩件事:它是怎麼來的,以及誰因此睡不着覺。

不練模型,只跑推理

別把Jalapeño當成通用GPU的替代品。它不負責訓練模型。

它只有一件差事:當用戶給ChatGPT發消息、讓Codex改bug、請AI助手跑長任務的時候,在服務器那頭用最低的功耗把推理算完。

聽起來不如"訓練芯片"熱鬧,但OpenAI的財務部門可是心裏門兒清。訓練砸一筆大錢也就結束了,推理卻是每天洶湧幾十億次請求,電費、服務器折舊,沒完沒了。So,誰能把推理成本打下來,誰就能真正賺錢。

OpenAI給它的定位叫"Intelligence Processor"——智能處理器,而非行業慣用的"AI加速器"這個詞——就是想說明這不是一個啥都能幹的通用芯片,是專門為大模型推理從頭設計的。

架構上三件事貫穿了全部設計:砍掉冗餘的數據搬運、讓計算與內存及網絡的資源配比重新平衡、把實際有效利用率頂到離理論天花板最近的地方。

通俗講就是——通用GPU跑AI時很多算力耗在了數據搬來搬去上,Jalapeño從架構層面解決了這個問題。

AI畫了張電路圖,給自己造了副身軀

一顆高端定製ASIC,從架構設計到送廠流片,18個月算快的。谷歌TPU兩年一代,亞馬遜Trainium也差不多。9個月是破紀錄的速度。

關鍵因素有兩個。

第一,AI參與了芯片設計。

芯片設計最耗時的環節不是構思方案,是驗證——設計、仿真、debug、改、再仿真,反覆成千上萬輪,喫掉一半以上的開發時間。而AI恰恰擅長這種活:讀歷史設計數據、輔助寫RTL代碼、在驗證階段幫忙排查問題、參與佈局優化。OpenAI在公告裏明確說了,自家模型在加速設計流程上的表現"超出預期"。

這就形成了一個閉環:AI幫忙畫芯片,芯片造出來跑AI,更強AI下次畫更好的芯片。

第二,帶隊的人。

OpenAI硬件團隊由Richard Ho領導。他在谷歌待了將近九年,是Cloud TPU的核心工程負責人,帶着多代TPU從概念走到了量產。之後去了光子計算公司Lightmatter做高級副總裁,再早還聯合創辦了EDA公司0-In Design Automation。芯片設計、AI加速、光互聯,三個領域全乾過。

分工很明確:OpenAI管架構和內核,博通負責硅片實現和Tomahawk網絡交換芯片,天弘科技Celestica做板卡和系統集成,台積電3nm製程製造。

英偉達看着客戶名單,客戶在另起爐竈

Jalapeño的意義比一顆芯片本身重得多。

拉一條時間線:2016年,谷歌率先發布TPU,當時英偉達GPU在AI訓練圈幾乎無人能敵。2018年,亞馬遜端出推理芯片Inferentia,四年後又加了訓練芯片Trainium。2023年,身為OpenAI第一大投資方和算力供應商的微軟,自己下場亮了Maia。今年4月,路透社挖出Anthropic也在琢磨自研。

到6月24日,OpenAI把Jalapeño擺上桌面,圈子又擴了一個。

你把這串名字連起來讀——谷歌、亞馬遜、微軟、Meta、OpenAI、Anthropic。每一個都曾是英偉達最捨得掏錢的座上賓,每一個都在暗處建起了自己的芯片工事。

Greg Brockman在發布聲明中說得直截了當:"世界正在邁向算力驅動的經濟。"

如果算力變成了和石油一樣的基礎資源,誰會把閥門全交給同一家供應商?

20美元月費買到的,可能翻倍

這件事的最大受益者不是投資人,不是技術極客,是每一個掏20美元開ChatGPT Plus的人。

推理成本砍下去,第一個直覺體感是速度快了。高峯期卡頓、排隊轉圈、聊久了越來越慢——這些毛病的根子全在推理算力不夠分。同樣規模的服務器集群,換上效率翻倍的芯片,吞吐用戶的能力就翻倍。

再往下推一層,免費版的邊界會被拓寬。現在深度研究、高級數據分析、完整版語音對話都鎖在Plus裏,不是因為功能本身成本高,而是給免費用戶放開之後的算力賬單喫不消。成本降下來,這道算術題的答案就變了。

而最隱蔽的變化不在價格標籤上。20美元可能還是20美元,但你買到的東西完全不一樣了——去年花這個錢只拿到一個GPT-4o,明年同樣的錢可能到手的是一個能自主跑完整工作流的agent。月費不變,能力翻倍,這本質上就是推理成本降價帶來的隱性贈送。

但Jalapeño瞄準的遠不止現在的ChatGPT。

Richard Ho的思路是,芯片要按模型未來6到9個月的發展方向提前造。等agent產品真上了量,每次交互的算力消耗和今天一問一答完全不在一個量級。基礎設施不提前準備,最致命的地方就會卡脖子。

從硅片到按鈕,OpenAI想全捏在自己手裏

OpenAI在公告裏的表述很直白。

大意是:我們不僅在開發最前沿的模型,不僅在模型上面搭產品,我們還在設計模型底下的每一層——芯片架構、內核、內存系統、網絡、調度、部署體系。

從硅片到用戶指尖點下去的按鈕,每一段鏈路都想自己控盤。

這套思路蘋果走過,谷歌也走過。但OpenAI比它們多了一層——讓AI參與建基礎設施,再用更強的基礎設施跑更強的AI。如果這個飛輪真的轉順了,它會自己踩油門。

首批部署定在2026年底,與微軟等夥伴在吉瓦級數據中心落地。芯片和配套服務器不外賣,純自用。博通CEO陳福陽在接受採訪時甚至說,2027年1.3吉瓦的部署預測都偏保守了,需求遠遠跑在前面。

Jalapeño只是第一代。下一代叫什麼還沒人知道。

但設計它的,大概率不會再只是人了。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10