金吾財訊 | 中金公司發研報指,傳統機器人在任務、場景和數據方面存在較強的專一性,泛化能力較弱,難以應對複雜環境,更偏向“人形機器”的屬性。相比人類學習,機器人在集體學習效率上具備優勢。目前行業已形成共識,即機器人大模型可通過融合視覺、觸覺等多模態信息,彌補機器人在“物理常識”方面的不足,是推動產業向通用具身智能邁進的重要路徑之一。大語言模型在自然語言處理領域雖發展成熟,能提供專業的信息諮詢與方案建議,但暫無法直接解決機器人物理操作問題,且存在“幻覺”現象,在與機器人技術整合過程中也面臨困難。自動駕駛模型與機器人在感知、決策、執行的底層技術上有相通之處,但機器人面臨的場景更復雜、對通用性要求更高,自動駕駛領域存在的極端場景泛化不足、安全冗餘失衡等問題,機器人目前也難以有效突破。商業化進程中,“硬件優先”(由車企、機器人企業主導)與“模型優先”(由AI企業主導)兩種路徑各有特點與優勢。受場景複雜度、技術門檻以及商業回報週期等因素影響,多數企業可能會聚焦於特定垂直領域,實現該場景下的“通用/柔性”應用;我們認爲,僅有少數具備全棧能力的企業,有望進一步突破至“具身智能”層級。該機構認爲機器人大模型是破解傳統機器人控制瓶頸、邁向通用具身智能的關鍵路徑。當前行業主要基於大語言模型、自動駕駛大模型及多模態大模型探索的發展方向,產業重心已轉向“小腦+大腦”系統研發,而不同企業在研發與商業化路徑上存在差異。