據報道,谷歌DeepMind專為機器人打造的AI模型系列Gemini Robotics更新,其研發團隊推出Gemini Robotics 1.5和Gemini Robotics-ER 1.5,它們協同工作,構成了機器人的「執行和決策系統」。
DeepMind表示,新模型加持的機器人可以主動了解周圍環境,以通用方式完成複雜的多步驟任務。我們正在推動物理代理(an era of physical agents)時代的到來——使機器人能夠感知、計劃、思考、使用工具並採取行動,以更好地解決複雜的多步驟任務,新模型是里程碑式成就,標誌着我們在解決物理世界中的通用人工智能(AGI)問題上邁出了重要的一步。
國泰海通證券指出,具身智能本質特點是具備理解物理世界並與之交互的能力。相比於傳統機器人控制,具身智能的核心轉變是實現了自主決策,讓機器人從根據指令執行特定任務的機器進化為持續與世界交互的智能體,因此大模型與數據是人形機器人最核心的環節。