小鵬的二代VLA到底是什麼?|新皮層

新皮層NewNewTh...
11/10

記者:吳一凡

編輯:吳洋洋

Key Points

小鵬目前站在一個多重意義上的高點,從汽車銷量到戰略佈局的完整性;

但能夠發佈demo和能夠量產是兩回事,對智駕系統、Robotaxi和人形機器人都是如此;

小鵬全方位學習特斯拉,從純視覺路線、產品生態到二代VLA架構;

小鵬是造車新勢力中第一個進軍Robotaxi的公司,但這項生意連特斯拉都尚未跑通;

去年小鵬還想讓機器人進工廠打工,今年它就推翻了這個戰略。

上個月,小鵬汽車的市值短暫超過了理想汽車,成為國內市值最高的造車新勢力公司。然而「汽車」這個詞,是兩家公司都想快速甩掉的。

小鵬想要甩掉它的速度比理想還要快。

11月5日,小鵬汽車在廣州舉辦科技日,slogan從去年的「未來出行探索者,面向全球的AI汽車公司」,升級為「物理AI世界的出行探索者,面向全球的具身智能公司」——僅僅是汽車的AI化已不足以滿足這家公司對自身戰略和市值的渴望。科技日中,小鵬汽車發佈了第二代VLA模型,以及包括Robotaxi、第二代IRON人形機器人和飛行汽車在內的三大具身智能產品。

何小鵬

何小鵬認為,繼互聯網、移動互聯網、數字AI時代後,數字世界和物理世界的融合將催生「物理AI」,機器將逐步擁有理解、交互和改變世界的能力。在這個概念下,小鵬汽車的業務涵蓋物理AI時代的技術底座,從模型到芯片,從基礎設施到上層終端,比如汽車、Robotaxi、人形機器人和飛行汽車。

這一戰略版圖被市場解讀為小鵬汽車是最像特斯拉的中國公司。目前,特斯拉的市值已達到1.4萬億美元,小鵬汽車的市值214億美元,和理想汽車差不多,高於蔚來汽車的170億美元(注:以上市值數據截至2025年11月7日美股收盤)。

證明了其二代IRON人形機器人裏沒有真人之後,小鵬美股股價在11月6日盤中一度漲超14%,市值再度超越理想。

公司成立10年後,小鵬終於站到了一個多重意義上的高點——今年其汽車銷量也大漲,銷售規模超過此前領先於它的理想。然而對這家公司來說,接下來不確定的事比確定的更多:首先是其11月5日發佈的第二代VLA到底是什麼,然後是人形機器人IRON會走貓步到底是不是足夠重要的創新,以及把未經量產驗證的VLA模型放在Robotaxi上是否真的可行。

能夠發佈demo和能夠量產是兩回事,對智駕系統、Robotaxi和人形機器人都是如此。發佈會結束後的媒體羣訪中,何小鵬也好幾次提到,「最難的是能不能量產」。

接下來的2026年,也就是何小鵬給出的量產目標年份(包括第二代VLA、人形機器人、飛行汽車),將是小鵬汽車的關鍵一年。

第二代VLA到底是什麼?

何小鵬在發佈會上透露,去年,團隊經過激烈討論之後,決定並行開發兩套智駕方案:第一代VLA和第二代VLA。前者的方案是V到L再到A,後者是V+L到A,也就是把L轉移到了輸入端。

何小鵬說二代VLA去掉了L,其實並沒有。

他解釋稱,第一代VLA模型中間涉及兩次語言轉換,這會帶來大量信息損耗,比如一段1200多字的文字描述也無法精準地「翻譯」一個十幾秒的視頻,而以視覺為核心——把模型看到的世界直接轉換成運動軌跡——仍然是不能放棄的方案。

於是,小鵬成立了兩個研發團隊,其中第二代VLA的研發由劉先明負責。到了今年二季度,在投入了3萬張卡的算力、用了1億視頻Clips(何小鵬稱,這個數據量相當於一個普通人駕駛6.5萬年遇到的極限場景之和)、燒了20多億元訓練費用後,第二代VLA跑通,小鵬內部便停掉了第一代VLA的開發工作。

不過,第二代VLA「拿掉L」的說法讓人感到困惑。「拿掉L」,本質上是回到了傳統的VA模型,只不過模型架構可能從CNN切換成了Transformer。但實際上,小鵬的二代VLA並沒有真的拋棄L,在何小鵬給出的模型架構圖中,L被當作V的並行信號,同時輸入給了模型,產出Action(動作)。但是這個作為輸入的L是什麼,何小鵬並沒有在發佈會上解釋。

一個合理猜測是,L仍然來自對V的轉譯,只不過小鵬汽車並沒有像初代VLA模型那樣直接讓轉譯產生的L輸入運動軌跡、形成Action,而是再次利用了來自V的信號,讓V信號和L信號共同對決策A產生作用,從而既利用了L的推理能力,又避免了僅僅將L作為決策表徵時會產生從V到L的「轉譯」過程中的信息損耗。

特斯拉在ICCV 2025上分享的架構與小鵬二代VLA類似。

這個架構的邏輯與特斯拉自動駕駛副總裁Ashok Elluswamy今年10月在ICCV 2025上分享的架構類似。儘管特斯拉並沒有表明這是否是他們最新一代技術架構,也沒有公開更多細節,但從分享中可以看到,特斯拉也沒有完全拋棄與V相關的多模態信號,而是讓這種多模態信號一方面產生L作為中間表徵,另一方面生成全景分割、3D佔用、3D高斯表徵等比原始多模態信號更高維的信號,然後讓這類多模態感知信號與L的自然語言解釋一起,共同決定輸出的Action。

何小鵬在發佈會結束後的媒體羣訪中給出的說法可以進一步驗證以上猜測。「我們說V+L,(轉譯環節)沒有變成人類的語言跟格式,而是變成了一個物理世界的新語言,所以它不是人類可見、可認知的語言。」他說。在特斯拉的FSD框架中,作為中間表徵的L和多模態感知信號的融合信號,就是一種非人類語言。

袁婷婷分享的小鵬二代VLA中,世界模型是其一部分。

11月7日的上海進博會上,小鵬汽車自動駕駛產品高級總監袁婷婷分享了她對小鵬二代VLA架構的理解,其發言進一步支持了其架構與特斯拉FSD的相似性。袁婷婷稱,「小鵬的二代VLA既是VLA模型,也是世界模型」。在其展示的PPT中,世界模型是作為二代VLA的一個記錄器存在的:當V和L作出車輛運動軌跡和動作決策時,這個決策會被記錄到世界模型中;同時,與這個決策一同被記錄的,還有決策前的車輛狀態,即V和L形成的感知信號。也就是說,小鵬二代VLA在用其VLA數據訓練世界模型。

特斯拉也將世界模型與智駕模型做了結合。

特斯拉也在這麼做,並且,它更進一步,會將世界模型預測的下一步世界狀態輸入給智駕系統,用以對智駕系統進行進一步評估和訓練。

但除了架構上的不同,何小鵬並沒有解釋二代VLA為什麼比一代VLA更好,以及它具備的哪些能力是第一代VLA不具備的。他只聲稱,「新一代VLA讓小鵬自動駕駛的升級換代節點提前了近兩年」,而且,二代VLA能在小路等複雜場景中表現得更好,在複雜小路的其平均接管里程將提升13倍,20公里的複雜小路僅需要接管1次。此外,他還提到,團隊在測試中發現,二代VLA湧現出了未特意開發的能力,比如在紅燈即將變綠的過程中,車輛開始緩慢地向前「蠕動」,以及看到路上有人招手就會自動停下。

在高速NGP(Navigation Guided Pilot,導航輔助駕駛)、城區NGP後,小鵬將上線「小路NGP」。明年第一季度,小鵬汽車將面向Ultra車型全量推送第二代VLA。另外,團隊正在評估將第二代VLA遷移至Max車型的可行性。

造車新勢力中第一個進軍Robotaxi,但這項生意連特斯拉都尚未跑通

小鵬VLA模型的另一個落地場景是Robotaxi。

本次科技日上,小鵬汽車宣佈將在2026年推出3款Robotaxi車型,同時啓動Robotaxi的試運營,成為國內第一家進入Robotaxi市場的新勢力車企。此前,蔚來汽車CEO李斌在2024年蔚來創新科技日上明確表示蔚來不會涉足Robotaxi領域,他並不看好這一商業模式;理想汽車CEO李想也在2024理想AI Talk節目中稱自己不想做Robotaxi,想把精力放在私人用車上。

據何小鵬介紹,小鵬的Robotaxi針對L4智駕系統設計,採用前裝量產模式,搭載第二代VLA模型,不依賴高精地圖和激光雷達——這是當前行業內最激進的方案,全球車企中可以對標的只有特斯拉。

小鵬計劃明年推出3款Robotaxi車型。

今年6月,特斯拉在美國德克薩斯州的奧斯汀市啓動了Robotaxi的試運營,首批投入的運營車輛為改裝後的Model Y,專門設計的Cybercab車型預計明年4月量產。其搭載的智駕方案仍處於保密狀態,市場普遍推測,該車隊運行的是一個專為L4設計的獨立軟件分支,技術水平領先於最近向公衆推送的FSD v14版本。馬斯克曾在2024年第四季度財報電話會議上提及Robotaxi業務時,使用了無監督FSD(Unsupervised FSD)這個概念。

另外,有研究員指出,FSD v14新增的「下車點選擇」(Arrival Options)功能很可能是由Robotaxi項目中「下放」的。並且,FSD v14已具備路牌識別、複雜交通流預判等推理能力,其底層架構大概率包含VLA相關設計。

但特斯拉Robotaxi的實際進度還達不到L4,公司管理層在今年第三季度財報電話會議上透露,其Robotaxi車輛目前仍配有安全員。

資本市場對特斯拉Robotaxi的態度兩極分化,將其視為高風險、高回報的典型。多家機構曾給出Robotaxi業務的獨立估值,最高可達數千億美元,但特斯拉必須向監管部門拿出FSD可以「無人」的安全性證明,而它堅持的純視覺方案在技術可靠性上能否優於Waymo等玩家的多傳感器融合路線,至今仍無定論。

這些橫亙在前的技術、監管、路線之爭的難題,小鵬同樣無法迴避。從L2輔助駕駛到商業上可行的、無人的L4自動駕駛,並非漸進式的過渡,而是要跨過技術與商業上的鴻溝。

商業模式上,小鵬表示不會扮演運營商的角色。目前,高德已與小鵬達成合作,後續小鵬的Robotaxi車輛將接入高德出行平臺。另外,小鵬還計劃推出私人模式的L4汽車,它與Robotaxi同源,擁有相同的硬件配置、安全冗餘和智駕能力,面向C端用戶銷售,可以進一步分攤BOM(Bill of Materials)成本和研發費用。

去年小鵬還想讓機器人進工廠打工,今年它推翻了這個戰略

同樣將搭載二代VLA模型的第二代IRON機器人則成了小鵬今年科技日最出圈的產品。它有性別設定、有仿人脊椎、仿生肌肉與全包覆的「皮膚」,能在臺上輕盈、優雅地走貓步,引發了一場「IRON是不是真人」的大討論,直到何小鵬第二天讓露出機械骨骼的IRON重新登臺走了一遍,爭議才平息。資本市場的反應同樣強烈:發佈會當晚下跌近4%的小鵬美股股價,次日盤中一度漲超14%。

如果擅長提供情緒價值的雷軍有弟子,何小鵬可以算一個。

事實上,小鵬人形機器人現階段側重的技術方向,並非行業內公認的難度最高的領域。人形機器人行業核心聚焦locomotion(移動控制)和manipulation(交互控制)兩大技術範疇,IRON憑藉「貓步」展現的是locomotion領域的優勢,而更多玩家在攻堅manipulation技術,包括抓、夾、疊等精細操作——難度更大,多應用於工業、家庭中的生產場景。

何小鵬也不是沒想過讓機器人進入工業場景。去年,他還在科技日上表示,第一代小鵬IRON將進入小鵬P7+汽車工廠擰螺絲,然而今年他已經打消了這個念頭。「打螺絲是我們兩三年前認為人形機器人最容易進入的場景,但是試了一年多,(我們發現)它不是。機器人最難的硬件是手部,機器人進工廠之後,不到一個月手就壞了。一個手有多貴?可以請一個工人(幹)幾年。」他在今年的科技日上說。

馬斯克就在為Optimus的手而頭疼。他在特斯拉第三季度的財報電話會議上稱,Optimus的手和前臂是一項極其艱鉅的工程挑戰,「從機電角度來看,前臂和手比機器人的其餘部分更難,但實際上,為了製造一個有用的通用機器人,你確實需要一隻不可思議的手。」

這導致Optimus的量產一直延期。最初,特斯拉計劃今年量產5000臺Optimus,但由於技術難題和供應鏈等問題,該計劃不斷調整,產量目標先降至2000臺,直到今年7月只實際生產了幾百臺,並中途停產。據The Information報道,停產的原因在於機器人手部和前臂設計遇到重大技術難題,同時已生產的機器人存在關節電機過熱、傳動裝置壽命短、續航能力差等硬件技術缺陷。

根據特斯拉最新公佈的時間表,Optimus第三代原型機的發佈將延期至明年第一季度,明年年底前完成第一條人形機器人產線的建設並啓動量產,年產能100萬臺。第二條產線的產能規劃是1000萬臺,用於生產第四代Optimus,但這一目標十分遙遠。至於第三條產線,「可能會建在火星」,馬斯克在幾天前的股東大會上開玩笑說。

可以說,小鵬暫時繞開了這道難題,先把更多的精力放在了機器人的外觀和移動上,「在人形機器人上,不同的公司會選擇不同的商業化方案,在我們公司有一些規則,就是讓我們的機器人不要有太多用手的操作,以及我們也想在機器人的智慧或者是智力方面,做一些循序漸進的發展。」何小鵬在採訪中說。

他也明確表達了想要IRON儘快商業化的想法,但不是宇樹那種能跑步、能跳舞的商業場景。「(機器人)可以做成非常好的秀,但不是我們真正要商業的目的。」何小鵬說,小鵬汽車做機器人項目最難和最重要的是「如何把它商業量產」,而「不是能夠去孖展」。基於這種戰略選擇,IRON將率先落地導覽、導購、導巡等服務場景。他認為,在中國市場,綜合考慮工作效率、技術成熟度和商業成本等因素,工廠並非人形機器人初期落地的最優場景;讓人形機器人做家務的難度也極大——既無法保障安全性,也很難泛化。而要能完成擰螺絲、做家務這類任務,可能還要3到5年。

或許對小鵬來說,未來終究要直面並解決靈巧手的技術與製造問題。從locomotion到manipulation,後者纔是制約整個人形機器人行業走向通用化、實用化的核心瓶頸。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10