機器人AI或迎"ChatGPT時刻":舊金山初創公司Physical Intelligence發布新模型π0.7,展現出從未訓練過任務的自主執行能力,令研究人員自身都感到意外。這一"組合泛化"突破,有望徹底顛覆機器人商業化路徑,該公司估值也隨之從56億美元飆向110億美元。
機器人AI領域或正迎來類似大語言模型的能力躍遷時刻。
總部位於舊金山的機器人初創公司Physical Intelligence周四發布最新研究,稱其新模型π0.7能夠指揮機器人完成從未經過專項訓練的任務——這一能力甚至令公司自身研究人員感到意外。
該公司聯合創始人、加州大學伯克利分校教授Sergey Levine表示,這標誌着機器人AI正在從"死記硬背"走向"舉一反三",其能力提升速度將超越訓練數據規模的線性增長。
這一突破若得到外部驗證,將對機器人行業的商業化路徑產生深遠影響——機器人有望在無需額外數據採集或模型重訓練的前提下,被部署至全新環境並實時優化。與此同時,據報道Physical Intelligence正就新一輪孖展進行洽談,估值或從56億美元接近翻倍至110億美元。
核心突破:從"專項記憶"到"組合泛化"
Physical Intelligence成立僅兩年,此次發布的π0.7模型所展示的核心能力被研究人員稱為「組合泛化」(compositional generalization)——即將在不同場景下習得的技能加以組合,從而解決模型從未遇到過的新問題。
這與此前機器人訓練的主流範式截然不同。過去的標準做法本質上是「死記硬背」:針對每一項具體任務收集數據、訓練專項模型,再對下一項任務重複這一流程。π0.7打破了這一模式。
Levine將這一轉變類比於大語言模型領域曾出現的能力躍遷:"一旦跨越那個臨界點,從只能完成有數據支撐的任務,轉變為能夠以新方式重新組合技能,能力提升的速度就會超過數據量增長的線性比例。這種更有利的擴展特性,我們此前已在語言和視覺領域觀察到過。"
關鍵演示:空氣炸鍋實驗揭示"知識湧現"
此次研究中最具說服力的演示,來自一台模型幾乎從未在訓練中見過的空氣炸鍋。研究團隊事後排查發現,整個訓練數據集中僅有兩條相關記錄:一條是另一台機器人將空氣炸鍋推關,另一條來自開源數據集,記錄了一台機器人按指令將塑料瓶放入其中。
然而,π0.7將這兩段碎片化信息與更廣泛的網絡預訓練數據加以整合,形成了對該設備運作方式的功能性理解。在零提示的情況下,模型嘗試用空氣炸鍋烹飪紅薯,取得了基本可接受的結果;在獲得逐步語言指引後,任務執行成功。
Physical Intelligence研究員、斯坦福大學計算機科學博士生Lucy Shi描述了一個早期實驗的戲劇性轉變:初始成功率僅為5%,但在花費約半小時優化對任務的描述方式後,成功率躍升至95%。"有時候失敗不在機器人,也不在模型,而在於我們自己——提示詞工程做得不夠好,"她說。
研究科學家Ashwin Balakrishna則表示,過去他總能根據訓練數據預判模型的能力邊界,"但過去幾個月是我第一次真正感到驚訝。我隨手買了一套齒輪,問機器人能不能轉動它,它就直接做到了。"
侷限性:研究人員主動劃定邊界
研究團隊對模型的侷限性保持坦誠。π0.7目前尚無法從單一高層指令出發,自主完成複雜的多步驟任務。"你不能對它說'去給我做片吐司',"Levine說,"但如果你一步步引導它——'對於烤麪包機,打開這個部分,按那個按鈕,做這個'——它通常能做得很好。"
此外,機器人領域目前缺乏標準化基準測試,使得外部驗證存在相當難度。Physical Intelligence選擇將π0.7與自家此前的專項模型進行對比,結果顯示這一通用模型在製作咖啡、摺疊衣物、組裝箱子等複雜任務上達到了專項模型的水準。
論文本身在措辭上也保持審慎,將π0.7描述為展現出泛化能力的"早期跡象"和"初步演示"。當被直接追問基於上述研究的系統何時能夠實際部署時,Levine拒絕給出預測:「我認為有充分理由保持樂觀,進展速度也比我兩年前預期的要快。但這個問題我很難回答。」
資本押注:估值或翻倍至110億美元
Physical Intelligence迄今已累計孖展逾10億美元,最新估值為56億美元。據報道,該公司目前正就新一輪孖展進行洽談,估值或接近翻倍至110億美元。
投資者對這家公司的熱情,在相當程度上源於聯合創始人Lachy Groom的背書。Groom此前是硅谷最受認可的天使投資人之一,曾投資Figma、Notion和Ramp等知名公司,在決定聯合創立Physical Intelligence之前,他將其視為自己一直在尋找的那家公司。這一背景幫助這家初創公司吸引到了機構資金,儘管公司始終拒絕向投資者提供商業化時間表。
Levine在談及外界可能的質疑時,主動預判了批評方向:"針對任何機器人泛化演示,永遠可以提出的批評是——任務太無聊了,機器人又沒在做後空翻。"他對此提出反駁:真正能夠泛化的機器人系統,看起來永遠不如精心編排的特技演示那般震撼,但其實用價值要高得多。