巔峯對話具身智能：高光時刻的三個追問

　　炒股就看金麒麟分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！

2025年6月6日，北京智源大會的聚光燈下，一羣造夢者正重新定義生產力的新形態。當宇樹科技CEO王興興在現場對宇樹G1發出動作展示指令時，閃光燈此起彼伏；銀河通用創始人兼CTO王鶴勾勒的24小時無人藥店，驗證了具身智能的可替代價值；北京人形機器人創新中心總經理熊友軍則直指面形態之選的可見與潛在成本；穹徹智能聯合創始⼈盧策吾以"火鍋底料"妙喻VLA（視覺語言動作）模型的意義和侷限性。和其他生產力變革發生時一樣，人們時常高估了短期影響，低估了進化過程中的路徑選擇。這場對話不僅是技術討論，更是一部生產力變革的思考錄。

關於賽事，到底驗證了什麼

王興興：終極目標實現前，可產生商業價值

宇樹科技的終極目標是希望機器人解放人類的生產力，無論是在家庭還是在工廠，去從事一些辛苦的工作，本質上是希望通過AI技術讓機器人，尤其是人形機器人做各種全身動作。

跳舞、格鬥、包括端茶倒水、洗衣做飯，都是全身動作的一部分，所以我相信當AI技術包括具身智能技術發展到一定階段時，一個足夠智能的家用機器人肯定是可以跳舞、格鬥的。

但目前機器人還不能直接去家庭或工廠幹活，這是全球都面臨的問題。在終極目標沒有實現前，宇樹科技參加一些表演和格鬥比賽，是想給大家展示一下機器人發展的真實情況，併產生一部分商業價值。比如今年上半年人形機器人租賃市場比較火爆，本身已經帶來了一些產業價值。

王鶴：要反思炫酷功能在新環境下的成功率

具身智能當下的一個目標是要推動產業化，雖然我們看到了很多炫酷的功能，但也一定要反思這樣的技能在新環境下，在客戶需要百分百成功率的情況下，能不能成功。這也是銀河通用和智源聯合團隊的思考，就是先把最重要的技能打通。

如果我們能讓人形機器人24小時服務，這樣就能讓具身智能真正走向產業化、真正服務人民，是創造生產力的開始。現在銀河通用機器人已經在北京開了7家無人藥店，由銀河通用的人形機器人24小時揀藥、對接騎手，這樣無人藥店可以在夜間為急需用藥的患者服務，又不需要人類24小時在崗。今年（2025年）我們將在北京、上海、深圳一共開100家藥店。

我們希望後續將賽事在操作級別上對接起來，用賽事引領有價值、可落地的技能形成，讓生態轉起來。

關於形態，非要人形嗎

王興興：不堅持一定要做人形，但目前人形有很大優勢

我們曾經公開多次，不堅持一定要做人形機器人，機器人的腿可以有輪子、底盤，這是非常實用的。為什麼現在大家喜歡做人形機器人，尤其是上半身保持人的形態的機器人？因為現在AI主要基於人的形態進行數據採集或訓練，如果機器人的上半身和人的動作一致，數據採集會方便很多，也方便AI做訓練。全身動作也是一樣，但是如果把機器人做成別的樣式，就沒辦法做到跳舞、格鬥。

當真正的通用智能時代來臨時，機器人的形態會千奇百怪，它們會去工廠幹活、去醫院服務，形態甚至比現在多100倍。因為目前的AI是由數據驅動的，長的像人的機器人在訓練、落地的時候，會佔很大優勢。

熊友軍：人形機器人的市場容量會更大

具身智能的發展和形式，確實是多種多樣，不一定侷限於人形，人形只是一個比較好的載體。

這主要從未來市場的容量來考慮。現在的機器人不必像人，也可以是四足與輪式，這沒問題。從市場應用情況來看，最大的市場是走路、商用和家庭，今天的工廠應用場景只是開胃小菜。我認為人形機器人的市場容量比其他的機器人容量要大。

從人機交互來講，既然以後機器人會走入家庭和生活，成為我們的朋友，甚至成為我們的愛人都有可能，人形機器人可以更自然的人機交互並被人接受。另外，現在的環境大部分是為人設計的，部署人形機器人、讓人形機器人適應環境的過程非常便利，它們可以方便地使用我們的工具，不需要做太多的改造。雖然現在人形機器人在成本和技術上不佔優勢，但長遠看是一個很好的載體。

關於VLA模型，突破點在哪

王鶴：只是一個起點，還要不斷融合新的模態

自動駕駛驗證了端到端方案有更好的擴展性，能夠通過數據真正驅動模型，而不是靠無窮無盡的規則。從這個角度看，VLA模型最直接的意義在於視覺觀測，真正能夠充分地吸收數據背後的知識，讓模型發揮最大的性能。

目前VLA是具身智能研究的熱點，但要突破什麼有不同的觀點，有人認為應該把人類能做的一切事情快速地做進去，形成一個基座模型，我認為有點太着急了。人類除了視覺的輸入外，還有力覺、觸覺、嗅覺、味覺、溫覺、聽覺等，VLA只能是一個起點，要做到人類級別的具身智能，只能不斷地融合新的模態。

我認為VLA現在最適合做移動抓取和放置，這幾個技能基本靠視覺為主，末端加觸覺或力覺的傳感器就能很好地執行，而且在工業、商業、服務場景裏有非常廣泛的應用。

盧策吾：有很好的拓展性，但也有侷限性

V（Vision）理解世界、L（Language）溝通人類、A（Action）改變世界，這集合了機器人要乾的幾件事。VLA有很好的拓展性，但還是有侷限性的，還要繼續去推進。

想要具身智能逐步落地，面臨的一個很大問題是，如果要通用，就需要很大空間。具身智能跟無人車不一樣，無人車有兩個決策維度，不用碰撞、接觸，場景也相對固定，所以整個空間會比較小。

如果做通用，VLA需要壓縮不確定性，相當於VLA是一個火鍋底料，現在只是清水，服務一部分人，要服務更多人就需要不停往裏面加東西，本質是增加更多額外信息，使VLA更加強大，而且能夠兼容這個框架里加更多的信息，在端到端的模型裏壓縮它的空間。

記者手記：王興興，把舞台留給G1

在G1機器人成為流量擔當的這半年，它和創始人王興興同時出現在公衆面前的次數不多，智源大會算一次。

從主論壇舞台到台下自己的座位，王興興走得很匆忙。儘管提前設定了隔離線，也安排了安保人員，下場時他還是被團團圍住。

自2019年智源大會創辦，當年科技圈的頂流總會出現在現場。從某種程度說，王興興和G1是屬於2025的人形機器人代表"符號"。

2025年宇樹機器人從央視舞台走到馬拉松賽場，再走向格鬥台，踩在科技與娛樂的交界線上，收穫了前所未來的關注。

6月6日，G1機器人在完成左右勾拳等動作時，現場每個人都能清晰聽到金屬關節摩擦的聲音，隨後的一個挑釁動作既像是搞笑橋段，又像是對未來技術的大膽假設。

會場內，王興興和同行就機器人形態等分享觀點，會場外，宇樹G1機器人出現在宇樹科技自己的展位與智源研究院展位上，G1是少有的不需要移動吊架可隨時展示的人形機器人，金屬軀殼上，剮蹭的痕跡泛着金屬光澤。

王興興沒有在現場參與更多環節，也沒有與媒體進行更多互動，而是把舞台留給了G1，每個人都有更多機會認識這款產品，以及無數走向台前的人形機器人。

王興興和同行知道，真正的變革發生在代碼和齒輪的咬合處，而不是掌聲雷動的舞台。

北京商報記者魏蔚

海量資訊、精準解讀，盡在新浪財經APP

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

巔峯對話具身智能：高光時刻的三個追問

熱議股票