
9個月。
從一張白紙到芯片出片,OpenAI只花了9個月。這個行業正常走路,要兩到三年。
這顆讓全行業側目的東西叫Jalapeño——墨西哥辣椒裏辣度最溫柔的一個品種。名字起得謙虛,事情做得一點都不客氣。
6月24日,博通CEO陳福陽親手把工程樣片遞到了Sam Altman手上。OpenAI,正式拿到了芯片俱樂部的入場券。
真正讓業內坐不住的,不是這顆芯片跑分多高——實際上詳細的技術報告還沒公開。而是另外兩件事:它是怎麼來的,以及誰因此睡不着覺。
不練模型,只跑推理
別把Jalapeño當成通用GPU的替代品。它不負責訓練模型。
它只有一件差事:當用戶給ChatGPT發消息、讓Codex改bug、請AI助手跑長任務的時候,在服務器那頭用最低的功耗把推理算完。
聽起來不如"訓練芯片"熱鬧,但OpenAI的財務部門可是心裏門兒清。訓練砸一筆大錢也就結束了,推理卻是每天洶湧幾十億次請求,電費、服務器折舊,沒完沒了。So,誰能把推理成本打下來,誰就能真正賺錢。
OpenAI給它的定位叫"Intelligence Processor"——智能處理器,而非行業慣用的"AI加速器"這個詞——就是想說明這不是一個啥都能幹的通用芯片,是專門為大模型推理從頭設計的。
架構上三件事貫穿了全部設計:砍掉冗餘的數據搬運、讓計算與內存及網絡的資源配比重新平衡、把實際有效利用率頂到離理論天花板最近的地方。
通俗講就是——通用GPU跑AI時很多算力耗在了數據搬來搬去上,Jalapeño從架構層面解決了這個問題。
AI畫了張電路圖,給自己造了副身軀
一顆高端定製ASIC,從架構設計到送廠流片,18個月算快的。谷歌TPU兩年一代,亞馬遜Trainium也差不多。9個月是破紀錄的速度。
關鍵因素有兩個。
第一,AI參與了芯片設計。
芯片設計最耗時的環節不是構思方案,是驗證——設計、仿真、debug、改、再仿真,反覆成千上萬輪,喫掉一半以上的開發時間。而AI恰恰擅長這種活:讀歷史設計數據、輔助寫RTL代碼、在驗證階段幫忙排查問題、參與佈局優化。OpenAI在公告裏明確說了,自家模型在加速設計流程上的表現"超出預期"。
這就形成了一個閉環:AI幫忙畫芯片,芯片造出來跑AI,更強AI下次畫更好的芯片。
第二,帶隊的人。
OpenAI硬件團隊由Richard Ho領導。他在谷歌待了將近九年,是Cloud TPU的核心工程負責人,帶着多代TPU從概念走到了量產。之後去了光子計算公司Lightmatter做高級副總裁,再早還聯合創辦了EDA公司0-In Design Automation。芯片設計、AI加速、光互聯,三個領域全乾過。

分工很明確:OpenAI管架構和內核,博通負責硅片實現和Tomahawk網絡交換芯片,天弘科技Celestica做板卡和系統集成,台積電3nm製程製造。
英偉達看着客戶名單,客戶在另起爐竈
Jalapeño的意義比一顆芯片本身重得多。
拉一條時間線:2016年,谷歌率先發布TPU,當時英偉達GPU在AI訓練圈幾乎無人能敵。2018年,亞馬遜端出推理芯片Inferentia,四年後又加了訓練芯片Trainium。2023年,身為OpenAI第一大投資方和算力供應商的微軟,自己下場亮了Maia。今年4月,路透社挖出Anthropic也在琢磨自研。
到6月24日,OpenAI把Jalapeño擺上桌面,圈子又擴了一個。
你把這串名字連起來讀——谷歌、亞馬遜、微軟、Meta、OpenAI、Anthropic。每一個都曾是英偉達最捨得掏錢的座上賓,每一個都在暗處建起了自己的芯片工事。
Greg Brockman在發布聲明中說得直截了當:"世界正在邁向算力驅動的經濟。"
如果算力變成了和石油一樣的基礎資源,誰會把閥門全交給同一家供應商?
20美元月費買到的,可能翻倍
這件事的最大受益者不是投資人,不是技術極客,是每一個掏20美元開ChatGPT Plus的人。
推理成本砍下去,第一個直覺體感是速度快了。高峯期卡頓、排隊轉圈、聊久了越來越慢——這些毛病的根子全在推理算力不夠分。同樣規模的服務器集群,換上效率翻倍的芯片,吞吐用戶的能力就翻倍。
再往下推一層,免費版的邊界會被拓寬。現在深度研究、高級數據分析、完整版語音對話都鎖在Plus裏,不是因為功能本身成本高,而是給免費用戶放開之後的算力賬單喫不消。成本降下來,這道算術題的答案就變了。
而最隱蔽的變化不在價格標籤上。20美元可能還是20美元,但你買到的東西完全不一樣了——去年花這個錢只拿到一個GPT-4o,明年同樣的錢可能到手的是一個能自主跑完整工作流的agent。月費不變,能力翻倍,這本質上就是推理成本降價帶來的隱性贈送。
但Jalapeño瞄準的遠不止現在的ChatGPT。
Richard Ho的思路是,芯片要按模型未來6到9個月的發展方向提前造。等agent產品真上了量,每次交互的算力消耗和今天一問一答完全不在一個量級。基礎設施不提前準備,最致命的地方就會卡脖子。
從硅片到按鈕,OpenAI想全捏在自己手裏
OpenAI在公告裏的表述很直白。
大意是:我們不僅在開發最前沿的模型,不僅在模型上面搭產品,我們還在設計模型底下的每一層——芯片架構、內核、內存系統、網絡、調度、部署體系。
從硅片到用戶指尖點下去的按鈕,每一段鏈路都想自己控盤。
這套思路蘋果走過,谷歌也走過。但OpenAI比它們多了一層——讓AI參與建基礎設施,再用更強的基礎設施跑更強的AI。如果這個飛輪真的轉順了,它會自己踩油門。
首批部署定在2026年底,與微軟等夥伴在吉瓦級數據中心落地。芯片和配套服務器不外賣,純自用。博通CEO陳福陽在接受採訪時甚至說,2027年1.3吉瓦的部署預測都偏保守了,需求遠遠跑在前面。
Jalapeño只是第一代。下一代叫什麼還沒人知道。
但設計它的,大概率不會再只是人了。