對話逆矩陣陳博遠:22歲北大青年學者,勇闖世界模型原始創新|浪潮對話

鳳凰網科技
06/01

摘要:

2026年初,世界模型的賽道擠滿了急於入局的玩家,但多數產品仍停留在「表層的物理世界」——AI能畫出翻書的手,卻不懂書為什麼會掉。22歲的陳博遠想做一個「物理正確」的通用世界基座模型。

這位北大元培、NeurIPS Oral與ACL最佳論文獲得者,本科與師兄吉嘉銘創立逆矩陣科技(Physis),獲高瓴與燕緣聯合投資。當行業爭論視頻生成、3D重建與世界動作模型哪條路線更優時,陳博遠用強化學習押注另一條路:讓機器通過主動干預在隱空間理解因果,而不僅是被動觀察像素。

逆矩陣內部不設KPI,沒有部門牆。這支幾乎全部由「95後」「00後」組成的團隊計劃年底發布旗艦模型。在行業巨頭與具身智能公司環伺的賽道里,他們試圖證明:通用世界基座模型的原始創新,可以由中國團隊做出來。

鳳凰網科技《浪潮》出品

作者|董雨晴

2026年初,世界模型的競賽已從學術討論變成產業基礎設施之戰。李飛飛在硅谷推動3D重建路線,LeCun(圖靈獎得主楊立昆)押注隱空間表徵學習,而國內戰場同樣硝煙瀰漫:字節跳動、阿里巴巴騰訊先後組建世界模型團隊,試圖在物理AI的底座上搶佔先機。這不是普通技術上的創新,而是繼大語言模型後的下一個萬億級入口——從具身智能、嚴肅工業場景到可控核聚變仿真、商業航天訓練,任何需要AI理解物理規律的嚴肅場景,都依賴這層底座。

資本與產業界迅速達成共識:AI正從虛擬世界邁向物理世界,「教會機器理解重力、因果與狀態轉移」將成為通往AGI的下一塊關鍵拼圖。據業內估算,僅工業機器人訓練市場,世界模型的潛在規模就達數千億元;若算上具身智能、影視遊戲引擎、科學計算與消費級內容生成,整體天花板遠超當前大模型應用層。

然而,當巨頭們紛紛宣佈佈局、創業公司爭相貼上標籤時,真正的技術路線之爭才啱啱開始。視頻生成追求視覺連貫,3D重建追求空間逼真,強化學習追求通用泛化推理,每條路徑指向完全不同的技術天花板與商業邊界——有人做影視工具,有人做機器人大腦,有人做工業仿真。算力結構、數據與評估體系截然不同,每一個選擇都意味着截然不同的終局,沒有中間地帶。

而在這場尚處早期的競賽中,一支幾乎全部由「95後」「00後」組成的團隊正從無人區殺出。2026年初,北京大學元培學院大四學生陳博遠與同出北大的師兄吉嘉銘聯合創立逆矩陣(Physis)。公司成立之初即獲得超千萬美元孖展,由高瓴創投和北大系基金燕緣創投聯合投資。近期鳳凰網科技獲悉,他們又將完成新一輪孖展。

圖|左,陳博遠;右,吉嘉銘

22歲的陳博遠,身上貼着「NeurIPS亮點論文一作」「ACL最佳論文」「北大年度人物」「北大最高榮譽五四獎章」等標籤,是外界眼中標準的頂尖青年學者。這個月,鳳凰網科技《浪潮》和陳博遠進行了兩次深度的交流。

我們發現,在這場全新的AGI(通用人工智能)戰役中,陳博遠堅信「自己為人工智能而生」。也是這一輪AI競賽中,最有可能成為基礎研究和原始創新的代表。

談及AGI的競賽,他更關注第一性原理、無人區探索和Neolabs式組織——這是一個與主流商業敘事迥異的創業樣本:不設KPI、不劃部門、不急於商業化,甚至不急於證明自己「正確」。

通過這場深度對話,我們試圖釐清幾個核心問題:一支青年軍憑什麼闖入算力密集型的世界模型戰場?在行業巨頭與具身智能公司環伺的賽道,一家「做基座」的初創公司如何建立護城河?以及,當中國AI新生代崛起時,這種以技術信仰驅動的組織形式,究竟能走多遠?

以下是對話實錄,在不改變原意的情況下經編輯發布。

「世界模型是無人區,需要從0到1的探索」

鳳凰網科技:為什麼要投身到世界模型這個領域?

陳博遠:投身世界模型,是因為當前AI的能力邊界已經觸頂。大語言模型把"預測下一個token(詞元)"做到了極致,但token(詞元)是符號的、壓縮的,物理世界是狀態的、連續、充滿複雜約束的。當大家還在討論世界模型的視頻生成哪家效果更好時,我個人認為,真正的瓶頸是:AI從未真正"生活"在物理世界裏。

世界模型的本質不是生成更逼真的畫面,而是建立對物理因果的信念。無論是工業仿真、具身智能還是嚴肅場景、科學計算,底層需求都是同一個:讓AI理解"我做了什麼,世界怎麼變"。這是基礎設施。沒有世界模型,AI就走不出數字世界,真正來到物理世界。

我們選擇強化學習路線,是因為人類理解世界不是靠旁觀,而是靠干預。你推一下球,球滾了,撞上積木,倒了——這個state-action-next state(當前動作-動作-下一狀態)的轉移,纔是物理規律的本質。這條路還沒有標準答案,架構、數據、評估體系都是undefined(未定義的),我們在做一個從0-1的事情,但正是這種無人區的狀態,讓我覺得值得投入。

鳳凰網科技:你們做世界模型的目標是什麼?

陳博遠:我們公司堅信第一性原理——簡單,但能scale up(規模擴展)。因此,我們想要做通用世界基座模型——一個真正懂物理規律、物理正確的通用世界基礎模型,而不急着去做世界模型for 具身智能、for工業場景、for 遊戲,因為真實物理世界裏的規律是共通的,可以互相學習和泛化。做基座模型本身會給我們帶來更多洞察,到達更遠的遠方。它可能一開始有波折和探索,但一定會迎來一個技術奇點,之後模型能力和技術發展會井噴式爆發。

鳳凰網科技:什麼叫做通用世界基座模型?

陳博遠:通用世界基座模型,就是物理世界的操作系統。就像大語言模型先學會語言規律,再去解決法律、編程這些具體問題一樣,世界基座模型要先理解重力、碰撞、因果這些底層物理規律,再自然地遷移到具身智能、嚴肅工業仿真、科學計算、遊戲物理引擎等不同場景。

現在行業裏很多模型是為單一場景訓練的,見過汽車但是卻不懂機械臂。但我們相信真實世界的規律是共通的,推一個球和開一輛車,底層都是力與運動的關係。通用基座模型要先把這些本質規律學透,而不是在像素層面擬合特定場景。

這個底座本身足夠簡單,但能scale up(規模擴展)。一旦底層規律開始湧現,它就能零樣本泛化到沒見過的物理環境,不需要為每個新場景重新訓練。先做透底座,上面的應用生態自然會開花。

鳳凰網科技:但大語言模型的架構積澱很長,世界模型還是很空白的。

陳博遠:這正是我們在探索的。

大語言模型出來之前有BERT、T5和各種設計,如何選對架構並能scale up(規模擴展)是關鍵。世界模型現在有各種技術路線——李飛飛的3D建模、LeCun在隱空間表徵裏的探索、還有基於視頻生成模型等。但我們認為,世界模型未來一定需要架構的變遷。對時序的建模、記憶機制、對世界的建構和理解、對狀態轉移的映射,是現有架構很難解決的。無論擴散模型架構還是其他方式,肯定需要底層的革新和創新。

鳳凰網科技:成立逆矩陣之前,你主要在做什麼?

陳博遠:我是高考到元培,大一到大四主線一直圍繞着科研展開。我在大一學了很多計算機視覺、自然語言處理的東西,然後接觸到強化學習這個方向。我一直有個目標,想實現真正超過人類智力水平的AGI,並且要能夠實際落地到技術產業變革裏面。所以我選擇了強化學習方向,因為它更貼近人類學習的方式,更能夠理解世界。

大一我就進組了,當時周圍大部分同學都在卷績點,但我還是想在元培學院自由探索的氛圍下自己想做的事情。當時認識了本科導師楊耀東老師,進入了課題組,遇到了現在逆矩陣的聯創,當時是我的師兄。比較幸運,大一就發了自己的第一篇文章,中了NeurIPS 2023。

我在大二、大三、大四的研究都圍繞着強化學習和強化學習在大模型上的應用展開,包括預訓練及後訓練、RLVR等方向。期間拿到了NeurIPS的oral(口頭報告),有一篇自己的亮點論文,還有ACL2025的最佳論文。那屆ACL全球就四篇最佳論文,我們是唯二的中國團隊,另一篇是DeepSeek梁文鋒的。我整個本科科研歷程走得還蠻全的,有點像讀了一個博士。

(注:NeurIPS是全球機器學習領域最頂尖的國際會議之一,與ICML、ICLR並稱為AI三大頂會,投稿錄用率常年低於25%,能中稿代表研究達到了國際前沿水平。陳博遠在大一就中稿NeurIPS 2023,這在本科生中極為罕見。而NeurIPS的oral口頭報告是從數萬篇投稿中遴選出不足0.5%的頂尖論文,需要在主會場向全體參會者做正式報告,代表該研究被國際AI社區認定為具有突破性或重大影響力。)

鳳凰網科技:做這麼多事情會不會很忙,怎麼分配時間?科研和學業怎麼平衡?

陳博遠:我會更看重用科研來解決實際問題。我選擇北大、選擇元培,是更加心儀這裏自由探索的氛圍。從大一開始我就給自己立了個目標,要去尋找更多的可能性。人工智能是我高二就了解的方向,在2021年北大線上講座上我萌生了對AGI的夢想。我覺得真正想做人工智能的同學,大家會自己去設計課表,主動點自己的技能樹,這就是passion-motivated(熱愛驅動)。

鳳凰網科技:強化學習跟你現在做的事有什麼關係?

陳博遠:2023年大模型剛興起時,我們發現大模型雖然能像人一樣說話,但解決不了1+1=2這種簡單問題。為什麼?因為世界的規律是分層次的。學說話容易,但不是所有人都能像牛頓那樣總結出重力定律。學習更深層的規律,需要強化學習。

通過明確的獎勵信號,讓它不斷自我博弈,湧現出預訓練階段的知識。

很多人認識我是因為 AI alignment 相關的研究——但我做的不是大家第一反應的"價值對齊"。其實alignment(對齊)分兩部分:一是oversight(監管),給賽車裝剎車;第二點也是更關鍵的是supervision(監督),提供獎勵信號、設計算法與架構,讓人工智能完成我們自己完成不了的任務,甚至超越我們,即可擴展監督。這其實就是我整個本科研究的脈絡。

2023年年初我們做強化學習for大模型,完全是從0到1的無人區探索。那時候大家都完全沒辦法想象一個純學校的團隊,能拿到頂會的最佳論文。原來認知裏這種最高王冠上的明珠應該是業內巨頭拿的,需要很強的資源支持。但我們從山底走到了山頂,沒有標準答案,全都是未被限定的東西,怎麼在這個領域做出真正突破?這非常考驗技術直覺、團隊配合和創新能力。

這也是為什麼我堅定選擇出來創業。無論科研還是創業,對我來說有兩個核心關鍵點:第一是使命,我們做什麼;第二是團隊。從使命上說,我們希望讓通用基座模型去學習世界的規律、讓底層規律湧現。從團隊來說,我們也經歷過從0到1探索科研無人區的過程,二者是共通的,現在世界模型的路徑也沒有收斂,需要探索和確定。

鳳凰網科技:目前逆矩陣的團隊構成是什麼樣的?

陳博遠:幾位聯創,都是之前彼此非常信任的夥伴。團隊現在20到30人,一半是奧賽金牌、省市狀元,有豐富的學術和科研經歷。AI這波浪潮越年輕、越聰明的人,越能湧現出讓人驚歎的想法。還有一半是來自大廠的工程人才,負責把工程做紮實。Infra(基礎設施)越來越重要,在構建基模的過程中,工程上可實現、高優化、硬件親和是更加重要的。像Claude Code 意外「開源」後,大家發現裏面的Infra(基礎設施)和Harness Engineering(訓練架構工程)有很多設計。

我們內部既有仰望星空做探索的人,也有腳踏實地做工程落地的人。外界評價我們是「中國的Neo Labs」——一幫最年輕、最有熱情、最有闖勁的人,做出突破性成果。

我常把我們比作一艘快艇,雖然小,不像遠洋貨輪體量大,但船上每個人都是舵手,每個人都能決定前行方向,進步非常快。我們內部的組織形式叫「no walls」(打破部門牆)——沒有KPI,沒有部門劃分,甚至沒有明確分工,只有分工偏好。真正有技術品位的天才和工程師聚在一起,部門和KPI反而會施加過多負擔。很多創新就是兩三個人做出來的核心突破,然後大規模scale up(規模擴展)。

OpenAI剛開始也只是一個小實驗室,2021年的時候在Stanford(斯坦福大學)、Berkeley(加州大學伯克利分校)講scaling law(規模定律)的故事,但2022年之前沒人相信。就是有這麼一批堅持的人做出來了GPT系列、ChatGPT。世界模型也在等待自己的「GPT時刻」,需要一批志同道合、熱情驅動的人去做突破。

鳳凰網科技:你覺得你們能成為「北大之光」嗎?這輪大模型跑出來的Kimi、智譜都是清華系的,你作為北大人怎麼看?

陳博遠:我們當然希望能成為北大之光,為北大在AI時代的突破和創新添磚加瓦,但這個標榜太大了。我們更多是希望在這個時代發出北大青年和北大AI創業者的聲音。世界模型是全球競爭的關鍵陣地,美國有李飛飛,歐洲有LeCun,我們希望作為北大校友企業,能在世界模型這個前沿方向上做出中國自己的原始創新。

我們三個聯創都是北大出來的,去年我和嘉銘都拿了北大年度人物。學校層面非常支持我們。北大的很多人才在大廠當技術負責人——羅福莉、林俊暘,還有超算隊的學長們在DeepSeek、Kimi擔任重要職務。我們現在希望自己能有一個公司出來,凝聚北大、清華乃至全國的人才,去以中國原創技術參與全球人工智能前沿競爭。

鳳凰網科技:我了解到,近期智源研究院也官宣你擔任行為世界模型中心主任,這是出於一種什麼的考慮?

陳博遠:我們團隊和智源研究院頗有緣分,在技術路線上也高度同頻。

智源的核心定位是實現人工智能領域從0到1的原始創新與前沿基礎研究。智源從2022年佈局多模態,到2024年發布Emu3(Emu,多模態世界模型)登上《Nature》(《自然》雜誌)正刊,再到2025年推出Emu3.5實現從"預測下一個token(詞元)"到"預測下一個state(狀態)"的躍遷——這是國內最系統、最深入的模型技術沉澱。這些積累不是短期能追上的,它們代表了智源在架構、數據和infra(基礎設施)上的長期投入,也是對於構建世界基座模型關鍵的積累和洞察。

更關鍵的是人。智源學者計劃裏有40位38歲以下的青年科學家,青源會匯聚了2000多位海內外青年學者。智譜AI(智譜人工智能)、月之暗面、面壁智能、銀河通用這些公司的核心創始人,都曾在智源做過研究。這種生態意味着,你能隨時找到最懂基座模型的人討論,能在迷霧中快速驗證判斷。

逆矩陣聚焦通用世界基座模型的底層探索。智源行為世界模型創新中心是智源研究院專門設立,用於支持下一代通用物理世界基座模型的研發與創新,承擔更大規模、更系統的前沿攻堅。我在這兩個角色裏推動的是同一件事——讓AI真正理解物理規律。技術願景是統一的,凝聚共同的力量去逼近同一個目標。

「世界模型GPT-3時刻不是刷榜,是發現能scale up」

鳳凰網科技:世界模型的市場你怎麼看?

陳博遠:我們把世界模型分為W0到W5,類比自動駕駛的L0到L5。L0到L2是輔助駕駛,L3以上才進入真正的高級別自動駕駛。每個層級的市場越來越大。

現在大部分世界模型還處於W0、W1層次。視頻生成模型能生成連貫好看的視頻,但會出現穿模、不符合物理規律——比如你雙手捧着書本,翻書時憑空出現第三隻手。這解鎖的是影視、遊戲引擎等對物理要求不高的市場。

但具身智能、嚴肅工業場景仿真、可控核聚變、商業航天、醫療等場景,都需要物理正確的世界模型。物理AI對應的市場,比現在說的影視或具身智能大很多倍。現在工業裏機器人還要用圍欄圍起來,因為它無法做反事實推理,預判不了安全後果。本質上是不理解物理規律。

而在市場前景方面,僅工業機器人訓練市場,世界模型的潛在規模就達數千億元;若算上具身智能、影視遊戲引擎、科學計算與消費級內容生成,整體天花板遠超當前大模型應用層。問題的關鍵在於,世界模型不是"更好的生成",而是物理世界的基礎設施與操作系統。

鳳凰網科技:目前來看,你覺得真正做世界模型的對手多嗎,你怎麼評價他們的路線?

陳博遠:很多人都在做世界模型,但視角不同。李飛飛主張3D重建,希望通過3D高斯潑濺等方法從0到1模擬世界。但建構世界不代表理解世界——我知道杯蓋要在杯子上,但不一定理解杯子灑了水會倒出來。

LeCun(楊立昆)主張在隱空間通過自監督學習,自然湧現對世界的表徵和物理規律的理解。還有其他做多模態大模型、視頻生成模型的技術路線。

我自己是強化學習背景出身。世界模型最早可追溯到1943年認知科學,在AI的發展長河中,強化學習之父、2024年度圖靈獎得主Rich Sutton 首先在1991年提出Dyna架構,將強化學習與規劃型世界模型結合,讓智能體在真實環境學習的同時,利用模型生成「想象經驗」提升效率,確立了Action作為世界模型必需輸入的核心範式,支持依託行動推演環境狀態、實現反事實推理。

2018年David Ha和Schmidhuber 進一步規範世界模型架構,後續圖靈獎得主LeCun楊立昆進一步發展世界模型的架構,都與以Action為核心的強化學習密不可分。回到第一性原理:物理AI需要的世界模型,是一個學會「世界怎麼動」的模型。人類和世界交互分三步:理解世界(這是水、這是咖啡),建模到腦子裏(隱空間的信念),根據信念做決策(拿起咖啡),並在決策中更新理解。人類一直在學習的,是基於當前狀態採取什麼動作、導致什麼下一個狀態——這其實是強化學習裏的transition model(狀態轉移模型)。

從宏觀技術概念來說,智能的發展是在儘量最小化對於世界的不確定性。最小化有兩種方式:一是被動觀察,就是data scaling(數據規模化);二是主動干預。舉個例子:我看了很多咖啡杯落在桌上的視頻,可能學到桌子有「吸力」。但物理世界的因果性只有一種。什麼讓我從相關性變到因果性?是我主動施加干預——把咖啡杯推到桌子邊緣,發現它往下掉。這樣在我的假設空間裏,就能排除「桌子有吸力」的假設,學到真正的因果。

這在世界模型預訓練上尤為重要。真實視頻是低壓縮、高帶寬的。物理規律發生在物體之間,不是像素之間。但訓練過程中我們用了大量帶寬理解視頻動態和像素,這是消耗資源且欠優的。

鳳凰網科技:能不能再說的更具體點?

陳博遠:在大語言模型裏,語言為什麼能泛化?next token prediction(下一個詞元預測)這個範式非常反直覺,但符合第一性原理——簡單。信息論上,one token predictor(單個詞元預測)等於compressor(壓縮器)。語言是高壓縮的,包含了人類長久進化中的智慧。

但視頻不同。首先用了大量像素佔據畫面;其次很多信息不在裏面——咖啡杯裏可能有咖啡,但如果杯子不透明就看不到;重力加速度、風力影響,視頻模態裏很難包含。視頻還是2D的,怎麼擴展到3D空間?這些都需要突破。

鳳凰網科技:你們算過賬嗎?要做這個事要花多少錢、吸納什麼樣的人?

陳博遠:我面試時不太聊具體技術細節。每個人都有自己的技術積澱和技術直覺。更多是對齊頂層願景——招的是志同道合、有技術追求的人。

至於花多少錢,算力肯定是關鍵。目前資金主要用在算力和招人上。但我們不是那種為了融錢而融錢的公司。我們孖展節奏是圍繞技術來的——我們內部看到的是構建基座模型所需要的更大規模算力、更多數據、更大尺寸模型的需求。技術是第一驅動力。

鳳凰網科技:目前團隊人員佔比最多的是什麼樣的人才?

陳博遠:五五開。一半是年輕的科研青年,一半是大廠工程人才。我們非常重視前沿技術研發,這一定是摸高、是未來。同時非常重視Infra(基礎設施)。

目前在我們看來,每一項任務都重要。算法建立在好的基建和數據上。Infra的架構設計、訓練組織、底層創新,在AI時代越來越重要。OpenAI最近也在說Harness Engineering。

鳳凰網科技:看起來你們的入場時間會有點晚?市場能給你們多少時間?

陳博遠:OpenAI一開始也不是Transformer的發明者,但確是把這個架構發揚光大的機構。我們不會慢。

大家現在都說自己達到「GPT-3時刻」,我覺得所謂「GPT-3時刻」不是在排行榜上刷高分,而是你真正發現通過擴大算力、數據、規模,能獲得明確的表現提升——我們內部是能觀察到這種跡象的。

我們是一家AI native(人工智能原生)的公司,沒有路徑依賴。我始終認為,在現在的時代背景下,只要實現真正的技術突破,商業化只是過程中「低垂的果實」,可以在迭代中「沿途下蛋」。我們現在還是想核心做好通用世界基座模型這一件事。

就像我們的中文名逆矩陣,英文名Physis,physis是physics的希臘詞根,其首字母φ代表黃金比例。我們認為世界存在一個「逆矩陣」的黃金分割。我們計劃今年年底發布一個旗艦模型,中途會有一些開源切片,給社區帶來不一樣的視角。

「條條大路通羅馬,但有些路有天花板」

鳳凰網科技:現階段有哪些可以分享的成果?

陳博遠:我們是希望迴歸第一性原理,通過一個通用的世界基座模型,One for All 解決不同的下游真實物理場景需求,這需要架構、數據、算法的多重創新。架構上,壓縮過程需要轉變。硅谷應用DINO架構比較多。我們在探索如何壓縮數據——數據建模過程中,要先嵌入到一個向量空間。不同編碼方式會損失不同信息,比如傳統VAE是從重建的角度來壓縮,會丟失很多信息,其實是不太符合信息論上最優編碼的原理的。

數據也是關鍵。每家公司都說自己的數據金字塔,關鍵是有沒有系統可擴展的數據pipeline(流水線),以及獨特的經驗和洞察。

我們內部發現,具身智能現在開始做ego-centric(第一人稱視角數據)。以前大家關注第三人稱全景建模,但對世界模型來說,第一人稱更重要——它天然代表了主體和世界如何交互、產生什麼後果,帶着state(狀態)、action(動作)和next state(下一狀態)的轉移。

遊戲引擎、虛幻引擎裏的數據也非常重要。人類學物理也不是直接學微積分,是從1+1=2開始,到平面直角座標系,再到微積分。我們發現學物理也有「課程學習」的概念——正確率在0.3到0.8區間的題目,從易到難,效果最好。物理引擎代表人類熟悉的簡單規則,是學習更復雜真實物理世界的基石。

鳳凰網科技:你們是共創氛圍,還是有核心作者把握整體方向?

陳博遠:更偏向共創。我們內部沒有部門牆,也沒有KPI,甚至沒有分工。但不是說大家幹一樣的事,而是主觀上每個人都有主人公意識,從「完成一件事」到「做好這件事」,而且站在上一層思考。

比如數據團隊的人會想:如果我要做最好的世界模型,該怎麼協調數據、評估、算法?然後再思考自己這部分怎麼探索。

我們這裏不論資排輩。真正有技術創新的是兩三個人做出核心突破,然後傾注資源scale up(規模擴展)。過往很多探索就是兩三個人——可能一個狀元加一個金牌——做出來的。這有點像DeepMind的創始人Demis Hassabis曾經說要做諾貝爾獎最多的公司,內部就是兩三個人一個方向,誰做出來就傾注資源。

鳳凰網科技:你們這個風格是行業普遍共識嗎?DeepSeek也是這個路線,Kimi也在往這個方向走。

陳博遠:我們跟DeepSeek、Kimi的同事都聊過。我個人欣賞這種純實驗室的形式,因為這種研究形式最容易做出創新。我們瞄準長期主義,組織形式是為創新而生的,不是為高效管理。羅馬軍隊的組織架構思維能高效管理,但未必能激發創新。

鳳凰網科技:創業以來,最大的困難是什麼?

陳博遠:在研發方面,技術的碰壁對我們來說很正常,今天有挑戰,明天可能就解決了。碰壁和創新在無人區探索裏是必然的。

打個比喻,我自己很喜歡騎車,我們大家會一起騎香山西山。技術攀登過程中,團隊裏有人出來「破風」——騎行隊伍裏破風者給後面的人引導。每個時期有不同的破風者,這樣整個車隊才能更快到達山頂。

對我來說,更大的挑戰是組織形式。我們凝聚了一幫最聰明的大腦,每個人有自己的技術偏好和直覺,怎麼把大家組織起來、讓創新氛圍凝聚?隨着團隊規模擴大,這需要思考。

我們給每個人配了Coding Agent(代碼智能體),每個新人入職第一件事情是我們手把手地教會他我們用來提效的AI工具,核心洞察和創新需要人想,但基礎工程實現,AI 智能體能幫大忙。現在每個實習生每月有2000美元的Coding額度,正式員工更自由。我們衡量過,一個人操縱4個agent,能頂原來10個工程師的工作量。

雖然AI能幫助完成80%的工作,但剩下20%的人力非常關鍵——對代碼風格、工程組織、Infra(基礎設施)設計、Harness 等(訓練架構工程),需要人類介入進行評判和把關。

鳳凰網科技:大廠也在往這個方向走,比如騰訊也想打破部門牆來湧現創新。

陳博遠:遠洋貨輪體量大,很難輕易轉向。初創公司像快艇,每個人都是掌舵人,能更快跑出來。技術路線不可能一條路走到黑,需要在迷霧中前行,有曲折、有折返。大廠擅長把創新從1做到10、從10做到100,但從0到1的探索,可能更需要初創形式和自由氛圍。

鳳凰網科技:你覺得李飛飛、LeCun跟你們是路線分歧還是正確性分歧?

陳博遠:大家對最終目標的理解也不同。李飛飛從計算機視覺角度思考世界模型,從0建構一個逼真世界。LeCun想在隱空間層面做到最好。

但JEPA系列一直遇到表徵坍縮——loss(損失值)降到最低不代表學到最好。比如所有物體都可以用「桌子有吸力」解釋,loss能降到最低,但換個情況就不成立了。

強化學習裏有個經典案例:機械手拿水杯,用RGB相機觀察。訓練結果loss很低、獎勵很高,但策略是什麼?機械手不斷在相機前移動,把相機遮擋住——符合獎勵信號,但沒完成任務。

我們堅信隱空間代表未來方向,比像素空間更好優化,更代表世界理解的本質。但在隱空間裏怎麼探索、怎麼引入動作的因果,是我們更需要的路線。

大家看到不同的遠方。我們認為未來世界模型或AGI的遠方,是能自主理解、學習和發現物理規律。就像現在大家嘗試用大語言模型解決物理和科學問題,未來物理AI也可以在我們的世界甚至地球之外裏不斷探索和在線學習,發現新的物理規律。

條條大路通羅馬,有些路有天花板上限,有些能走向最終遠方。不同路徑之間會有互相借鑑。

「護城河是人,是knowhow,是快速遷移的能力」

鳳凰網科技:如果你沒創業,最想去哪家創業公司或大廠?

陳博遠:我一定會選擇創業。跟我的成長經歷有關。小時候家裏比較散養,我對數學感興趣,小學學完初中知識,初中學完高中知識,不是為了應試,就是覺得探索數學規律有意思。

高二在線上的北大講座上,了解到人工智能。當時在沙發上聽課,開着空調喫西瓜,我至今記得那個感覺,就是覺得我就是為人工智能這個學科而生的,我天生就是學這個的人。

高三課桌上有個紙條,寫着「北京大學元培學院 人工智能」。這三個詞激勵我來到元培。

創業的想法一直在腦子裏萌生。做科研的過程中,想法越來越清晰。我發現真正有價值的技術,大家會以開源形式發出來,學術論文會越來越少。我自己算過一個數:從第一次工業革命到現在,技術革新的間隔在不斷壓縮——從將近一百年,到幾十年,到現在可能只有十年。2025到2035年是AI原始創新的關鍵窗口,窗口會慢慢閉合。

既然當下有想做的事、有技術理想、有這樣的團隊,為什麼不出來創業?

鳳凰網科技:外界都在講再造一個類似大語言模型的產業周期,造一個千億市值公司。在你們看來不是這樣?

陳博遠:如果我們真的做出物理正確的世界基座模型,應用到具身智能、嚴肅工業場景仿真,這確實是萬億級市場。但真正做技術研發的公司,不應該第一序列由商業驅動,應該由技術創新驅動。基模做好了,上面的生態自然會開花。

鳳凰網科技:你們做世界模型核心護城河到底是什麼?

陳博遠:很多人問,具身公司也在做自己的世界模型,會不會用更多數據超越你們?

數據金字塔也好、架構也好,每家都有自己的pipeline(數據流水線)和design(設計),這不是核心壁壘。真正的壁壘是人,是能不能有關鍵的knowhow(經驗)和insights(洞察)突破。還是那個例子,Transformer一開始不是OpenAI發明的,OpenAI o1的復現也不是大廠先做出來的,是DeepSeek。

如果過早聚焦於真機本身,可能導致過擬合。真機數據有用,但只有這些遠遠不夠。我們做的是第一性原理的事,一開始可能慢,但上限更高。就像Cursor早期佔據很多市場,但Claude Code出來後,大家看到了更強大的基座模型帶來的生產力變革。所以我相信在這樣一個高人才密度、扁平組織形式的地方,大家都是志同道合、自我驅動,原始創新的活力和火花是隨時迸發的。

鳳凰網科技:如果有一天你們的路線完全被替代了怎麼辦?

陳博遠:如果從架構來說,我們肯定是做出新架構的第一梯隊。架構的核心創新在於人,在於我們對這件事的理解和目標。有人想做長視頻編輯模型,架構就為那個服務。我們目標是物理正確的通用世界基座模型,架構為這個服務,不會偏離。

從歷史看,真正做出突破的AI公司,有些靠架構,有些不是。就像Google發明了新架構但早期沒跟上。架構是壁壘,但更重要的是架構之上、數據之上、算法之上,你獨特的經驗和洞察,以及團隊有沒有快速遷移的能力。

護城河的核心是我們有這樣一批人、這樣一個團隊、這樣快速的技術研判和快速遷移能力。最根本的是,我們是一個堅持長期主義和第一性原理的團隊。

鳳凰網科技:你們是用這種方式說服投資人的嗎?高瓴怎麼看?

陳博遠:我覺得其實不能說「說服」,是投資人重視的長期主義和我們的信念發生了共鳴,所以第一輪投我們。

鳳凰網科技:你怎麼勸那些天才加入你們?用組織文化和第一性原理說服他們?

陳博遠:不是說服,應該是互相吸引。我不會說「拉你進公司」,而是像朋友一樣聊頂層願景——你想在什麼樣的氛圍裏做成什麼樣的事?

越來越多人跟我說不太想去大廠了。去大廠是確定性輸入輸出,服務於產品線也許很好,但他們像黑馬,不想被限制在固定賽道和圍欄裏。我們內部崇尚自由創新探索的氛圍。一幫最崇尚自由的人聚在一起,才能做出更好的事。

鳳凰網科技:但大廠也意識到了,拿出更多錢和更自由的氛圍搶人,這對你們來說也是壓力。

陳博遠:錢是一方面。我們作為初創公司也提供很好的薪酬待遇,可能沒大廠多。但真正加入我們的人,都不太在意這個。核心驅動力是技術追求,更純粹。

「最好的時代」

鳳凰網科技:你覺得你們這些中國AI新生代趕上了一個好時代嗎?

陳博遠:我覺得對於現在搞科研的人來說,是最好的時代。

最好的時代是因為大家開始對中國AI新生代有信心。我是04年的,今年22歲,團隊裏還有比我小的。大家開始相信後浪能做出更本質的創新。

我們沒有生在AI發展的第一批,沒趕上深度學習剛出來的時候。但種一棵樹最好的時間是十年前,其次是現在。這也是為什麼我們堅定選擇創業,想在這個浪潮裏有自己的一朵浪花。

而且我們也是本土團隊,嘉銘拿了蘋果學者(內地僅兩位),我們選擇留下來。外界叫我們「中國的Neo Labs」,希望我們能做出突破性成果。

鳳凰網科技:你跟家裏人說本科畢業就創業、不讀研讀博,需要解釋嗎?

陳博遠:肯定有要解釋的地方。有人問我未來會不會讀博。我覺得當下重點是做好技術創新本身,之後是否讀博,一定是為技術創新服務。我爸媽比較支持我。

鳳凰網科技:硅谷從去年開始人才浮躁,扎克伯格開天價,傳到國內字節也在這麼幹。你們不受影響嗎?

陳博遠:DeepSeek、Google之前也聯繫過我,能拿到不錯的offer。我們幾位聯創和公司的人都能在大廠拿到非常好的offer。但大家核心還是想在國內去做最原始的創新。做技術的人都有意識無意識地感受到,底層創新要出現在自由探索的氛圍裏。

鳳凰網科技:你沒動搖過?沒想過去DeepSeek?

陳博遠:DeepSeek固然挺好,但我想的是,為什麼我們不自己組建這樣一個組織做底層創新?每個lab、每個公司的技術願景不一樣,看到的東西不一樣。去DeepSeek、Kimi能獲得很好成長,見識厲害的人。但我們同樣能凝聚這樣一批人,做自己更偉大的事業。在通往AGI的道路上,需要這麼一批有闖勁的人衝出來。

鳳凰網科技:你們幾個聯創是怎麼分工的?你在團隊裏算什麼角色?

陳博遠:我更多負責研發,可以叫研發負責人。我會以更全面的視角看整個技術願景,協調各個團隊。我自己也重度參與研發本身,關注算法和Infra。

嘉銘作為CEO把握大的方向。我們CTO更關注工程實現和落地,以及大規模Infra工程。我們內部所有的技術人員都坐在一起,有時候大家會有激烈的討論甚至爭吵,有衝突,但這是正常的——技術就是在摩擦中迸發火花,大家的爭論也是基於技術出發,希望尋找更加具有擴展性的技術路線。每次爭論後往往會產生新的想法、新的突破。最終實踐出真知,小規模實驗驗證可規模化的前景後,才真正押寶、上規模。

這個核心研發方向不是一個人決定的,由一個人決定會受到路徑依賴和個人技術直覺的侷限。合力的方向是我們共同決定的,只是有人定大體範圍,具體哪條路徑最合適,大家頭腦風暴。我雖然是04年的,但團隊裏還有比我更年輕的,他們提出的想法可能代表未來方向,我們可以不斷糾偏和調整。

鳳凰網科技:如果僅從我們今天的對話來看,我很難想象你是04年的,外界會不會質疑你們學生創業?

陳博遠:術業有專攻。有人會說你們是純學生團隊,會不會沒有產業化、工程化背景。但我們團隊裏不僅有最有闖勁的年輕人,也有從大廠出來的工程化人才。之後做產業化、商業化,也會吸納更多有洞察的人。元培本身就是跨學科的,我做過的很多工作,是從社會心理學、生物學獲得啓發,用到AI研究上。做公司也是跨學科——有人懂產業化,有人懂商業化,有人懂Infra,有人懂算法,術業有專攻。這種碰撞更容易迸發創新火花。

鳳凰網科技:你覺得自己是那1%的人嗎?

陳博遠:我不會標榜自己是天才或學霸。從高考上元培,到做學術創新,外界可能給我掛「天才少年」的帽子,但我並不是很喜歡這個稱呼,我更希望成為一個能更聚焦於技術本身,給這個世界帶來更美好的未來的人——技術驅動、熱情驅動,想做有價值、有意義的事。

團隊裏有很多比我強的。一個好的團隊,首先每個人要有自己的技術直覺,不然怎麼保證前進方向正確?原始創新是個很難的事情,對我們來說,不僅需要天才,更需要熱情驅動和自我驅動的人。在這艘快艇上,每個人都能找到自己的位置,一起掌舵。船長不是最關鍵的那個,每個系統、每個環節上的人都是最關鍵的。技術是平權的,每個人都有創新的權利。價值的認可需要時間,但探索本身就有意義。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10