OpenAI神祕「波蘭軍團」曝光,奧特曼:沒他們就沒有OpenAI

新智元
02/23

編輯:元宇 KingHZ

微軟CTO Kevin Scott的一封郵件揭開了OpenAI「波蘭軍團」的神祕面紗。

掌管OpenAI命運的,竟是6個波蘭天才?

OpenAI首席科學家Jakub Pachocki,接替Ilya之後,完成了後者多年來求而不得的突破。

奧特曼甚至專門發了一篇短文,提到OpenAI兩位不可或缺的人物:Jakub Pachocki和Szymon Sidor。

奧特曼認為他們兩人是天作之合,「OpenAI還沒有他們兩人沒法解決的問題」,沒有他們倆就沒有現在的OpenAI。

你可能不知道的是兩人在波蘭讀高中就已經認識,而網友Teortaxes拋出一張OpenAI團隊合影,波蘭人濃度爆表──

OpenAI團隊中六位頂級貢獻者均為波蘭人,從左到右分別為Jakub Pachocki、Łukasz Kaiser、Łukasz Kondraciuk、Szymon Sidor、Wojciech Zaremba、Jerry Tworek。

其中的Wojciech Zaremba,是OpenAI的十一位聯合創始人之一。

在OpenAI成立之初,波蘭工程師在團隊中佔據了相當大的比例,其中就有上面提到的Jakub Pachocki、Szymon Sidor、Łukasz Kondraciuk等人。

他們成為OpenAI最初團隊的核心力量,甚至在OpenAI內部還出現了「波蘭黑手黨」(Polish Mafia)這一說法。

他們在Slack上有一個共同的頻道,偶爾會往裏面發一些與AI相關的波蘭新聞。

被低估的OpenAI「波蘭軍團」

在OpenAI早期與核心研究中,有多位波蘭背景研究者或工程師貢獻突出。

其中有一位OpenAI的聯合創始人、一位前研究副總裁,還有一位是大名鼎鼎論文《Attention is All You Need》的合著者。

Jakub Pachocki

Jakub Pachocki

自2017年加入OpenAI以來,Jakub歷任研究總監等要職,是GPT-4等核心項目的領軍人物。

在OpenAI早期,他致力於大規模強化學習與複雜博弈系統的研究,通過 OpenAI Five (Dota 2) 等項目,從實踐層面驗證了「規模化訓練引發能力躍遷」的關鍵認知。

此後,作為核心負責人,他主導了 GPT-4 的研發工作,構建了集訓練、優化與可擴展性於一體的「工程—研究」閉環體系,並在利用強化學習提升模型複雜推理與代碼能力方面取得了突破性進展。

他的核心貢獻在於確立了大模型結合強化學習(RL)的規模化方法論,將前沿研究轉化為可複用的訓練體系,併成功帶隊交付了具有代際意義的關鍵模型。

2024年5月,Jakub接替Ilya Sutskever成為OpenAI首席科學家。

Łukasz Kaiser

波蘭計算機科學家和機器學習研究員,長期從事深度學習基礎研究。

他曾獲得德國RWTH Aachen University計算機科學博士學位,並在法國國家科學研究中心(CNRS)擔任研究員。

Łukasz Kaiser曾是Google Brain的研究科學家,對注意力機制和Transformer架構的發明貢獻巨大,是《Attention is All You Need》論文的合著者之一,這一架構成為了現代大語言模型的核心基礎。

Łukasz Kaiser

Łukasz Kaiser於2021年加入OpenAI,從事大模型與推理相關研究工作;公開資料顯示他參與過ChatGPT及GPT-4多模態方向的研發,並與團隊推進o1等推理模型相關工作。

Łukasz Kondraciuk

Łukasz Kondraciuk

波蘭工程師/研究人員,被列為OpenAI o1推理模型的貢獻者之一。

他是早期團隊成員之一,在ChatGPT和AI開發中有實際貢獻。

Szymon Sidor

Szymon Sidor目前擔任OpenAI的技術研究員,持有劍橋大學計算機科學學士學位,以及麻省理工學院機電一體化、機器人技術和自動化工程碩士學位。

Szymon Sidor

他自2016年左右加入OpenAI,是OpenAI早期研究者與核心技術驅動者之一。

他在構建GPT-4模型中發揮了重要作用,更是與Ilya、Łukasz Kaiser共同在大語言模型中引入強化學習(RL)的關鍵人物,直接催生了後來的o1推理模型。

奧特曼稱讚他為「不知疲倦」,指出他在解決看似不可能的問題方面的作用。

Wojciech Zaremba

波蘭裔計算機科學家,他是OpenAI的聯合創始人之一。

Wojciech Zaremba

Zaremba持有華沙大學和巴黎綜合理工學院的數學碩士學位,以及紐約大學計算機科學博士學位,曾師從Yann LeCun和Rob Fergus。

在加入OpenAI前,他曾在Google Brain和Facebook AI Research實習,從事神經網絡、對抗樣本和分佈式訓練等方面的研究。

2015年,Zaremba與奧特曼、馬斯克、Ilya Sutskever等共同創立OpenAI。

他最初領導機器人團隊,2020年後他轉向領導GPT系列模型、Codex和代碼相關團隊,是公司戰略和技術發展關鍵人物之一。

Jerry Tworek

也稱Jarosław Tworek,前OpenAI研究副總裁。

Jarosław Tworek

他在華沙大學獲得應用數學碩士,於2019年加入OpenAI,領導了o1、o3、Codex、GPT-4等早期工作,被業界譽為「大語言模型推理能力發展」的關鍵人物。

據媒體報道,2026年1月,他離開OpenAI,創辦Core Automation,開發需要更少數據和計算的新型AI模型。

他表示離開是為了追求在OpenAI難以開展的核心研究,並認為AI進入「研究時代」,需要新的突破。

Ilya、Tworek離去

「波蘭軍團」能否再造奇蹟?

2023年微軟CTO Kevin Scott郵件揭露,OpenAI首席科學家Ilya對門徒Jakub Pachocki研究突破和晉升不滿,導致與CEO奧特曼衝突,引發董事會解僱奧特曼事件。

Ilya的離開,是OpenAI在戰略轉型中,逐漸將算力資源向ChatGPT相關應用部門傾斜的必然結果。

在這個過程中,興趣在純研究領域的Ilya敗給了善於拿出實際成果的徒弟Jakub。

Scott在郵件中寫道:

Jakub比Ilya更能夠推動研究突破,以至於奧特曼晉升Jakub負責主要模型方向。此後Jakub工作加速,在最近幾周取得驚人進步。

導師地位被顛覆令Ilya難以接受,應用部門(如ChatGPT)成功導致研究部門GPU和人力短缺,在雙重因素的打擊下,心灰意冷的Ilya離開了自己參與創建的OpenAI。

令人唏噓的是,Ilya離去之後,今年1月,六人波蘭軍團中的一位——OpenAI研究副總裁Jerry Tworek也宣佈離職。

在OpenAI呆了整整七年的Jerry,因為多次向管理層申請更多的算力和人員支持無果,最後與Jakub Pachocki之間爆發了衝突:

Pachocki更看好現有的、能快速見效的大語言模型架構。公司需要的是能馬上落地的產品,而不是不知何年何月才能跑通的理論。

Tworek、Ilya等一系列核心科學家、研究員的離開,背後是ChatGPT等應用部門「喫掉」關鍵算力資源,基礎、前沿研究正在被邊緣化的現實,也曾被外部解讀為OpenAI理想主義的一種倒退。

甚至有網友認為,OpenAI將因此失掉其曾經在基礎研究領域的領先地位,只剩下品牌價值。

當AI已進入「研究時代」,對於OpenAI、Anthropic、谷歌DeepMind這樣的全球頂尖AI實驗室來說,基礎和前沿研究纔是推動發展的根。

沒有了研究上的領先,OpenAI想要複製下一個「ChatGPT」時刻就會遙遙無期,再厲害的「波蘭軍團」恐怕也無能為力。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10