智元世界模型:机器人的“大脑”,还是市值翻十倍的“样板间”?

市场资讯
Aug 17

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:观察者网)

8月14日,智元机器人把7月亮相过的世界模型GenieEnvisioner(GE)正式开源,并再次打出“行业首个面向双臂真机的世界模型”的概念。

官方演示里,机器人连续完成做三明治、倒茶、擦桌、用微波炉、装箱等长链条任务,看上去已颇具“人味儿”。

不过,这份“人味儿”能否在已经沸腾的二级市场上再来一次“空中加油”,还要看周一开盘。

此前的7月8日,智元机器人公告,正在通过“协议转让+要约收购”拿下材料供应商上纬新材63.62%的股权。而自公告以来,上纬新材一路走出11个涨停,市值从30亿元最高冲到400多亿元。

可以说,智元还没把世界模型卖进工厂,就已经把自己市值的杠杆放大到了资本市场。

智元GE 视频截图

智元的GE做了什么?

从智元官方发布的信息中可以看出,GE的核心突破在于,构建了基于世界模型的以视觉中心的建模范式。

不同于主流VLA(Vision-Language-Action)方法依赖视觉-语言模型将视觉输入映射到语言空间进行间接建模,GE直接在视觉空间中建模机器人与环境的交互动态。

这种方法完整保留了操控过程中的空间结构和时序演化信息,实现了对机器人-环境动态更精确、更直接的建模。

智元表示,基于3000小时真机数据,GE-Act在跨平台泛化和长时序任务执行上显著超越现有SOTA,也为具身智能打开了从视觉理解到动作执行的技术路径。

此外,智元机器人团队还宣布,将开源全部代码、预训练模型和评测工具。

智元方面表示,这是行业内首个真正面向真实世界双臂机器人的世界模型。GE平台把“预测—控制—评估“环节整合到了一起,标志着机器人从被动执行指令,转变为主动“想象—验证—行动“。

换句话说,机器人能够像人类一样,在实际操作前于“脑海”中模拟并验证动作。

据介绍,借助GE模型,智元机器人已成功实现半身移动任务,包括制作三明治、倒茶、擦拭桌面、使用微波炉加热以及在流水线上进行装箱等五项任务的依次完成。

智元机器人 官方网站

“机器人公司不做大模型将没有未来。”此前,在智元机器人发布首个通用具身基座大模型智元启元大模型之后,智元合伙人、具身业务部总裁姚卯青和智元具身研究中心常务主任任广辉曾这样表示过。

目前的大语言模型,仍普遍存在推理时间长,实时性差等问题。搭载大语言模型的机器人,控制在线决策至少需50毫秒,一般延迟为1至5秒,完全无法满足工业场景3至10毫秒的需要。

而本次智元机器人推出的,就是基于目前大语言模型技术限制而生的世界模型,是以智能体身体与环境的实时感知和交互为基础,构建的用于理解、预测和适应环境动态变化的模型。

具体来说,世界模型能够让智能体通过 “想象” 不同行动策略的未来状态序列,提前规划好步骤,选择最佳方案来执行。

智元AgiBotWorld 视频截图

3000小时数据,其实可有可无?

从传播的角度来看,智元机器人发布的开源世界模型,确实可以说是一次“秀肌肉”。不过如果深入到技术上,事情可能会有不同。

世界模型所需要的的训练数据,远超目前还未铺开的具身智能机器人可以提供的能力。

在今年6月,Meta开源发布的V-JEPA 2世界模型就使用了超过100万小时的互联网视频和图像数据进行预训练,不依赖语言监督;而谷歌旗下DeepMind的Genie3则采用了大量游戏引擎生成的数据集,也有消息称Genie3的训练数据或包含谷歌旗下的知名视频网站YouTube的视频及更多内容(尽管DeepMind称对此“持谨慎态度”)。

与之相比,目前搭载具身智能的机器人普遍还处于探索阶段,能产生的真机数据量级并不大,就以智元机器人本次训练使用的3000小时数据来说,其实对于世界模型能力本身的训练提升作用,微乎其微。

3000小时的真机数据对世界模型本身的能力增益,就像往长江里倒一桶纯净水——有比没有好,但没人靠它涨潮。

其实,关于具身智能机器人的数据需要,行业也存在争论:另一部分观点认为,世界模型的能力提升,与具身智能领域的数据多寡之间,并无强关联。

此前,在2025世界机器人大会上,国内具身智能领域另一龙头企业宇树科技的创始人王兴兴曾表示:“目前全球范围内,大家对于机器人数据问题的关注度,都有点太高了。现在最大的问题其实反而是模型。”

他认为,目前具身智能和机器人的模型架构不够好,也不够统一。

“在大语言模型领域,当有了足够多的好数据时,就能把模型训练得越来越好。但是在具身智能领域,会发现在很多情况下,数据采了却用不起来。大家对模型的关注目前是相对有点少,反而对数据关注有点太高了。”

世界模型是“地基”,具身智能是“楼房”

相关从业人士对观察者网表示,具身智能领域的“数据集不是越大越好”可能需要这样解释:世界模型本身的发展还需要依靠更多的互联网图像、视频,乃至于目前正在发展的AI眼镜等智能硬件产品提供的视觉信息。

而在具身智能领域进行的世界模型侧研发,更多是基于机器人的训练数据进行针对性的优化,对于模型本身的基础性能并没有太大的提升作用,因为具身智能机器人目前还没有办法提供能够满足模型训练需求的数据量。

在这个过程中,世界模型的基础能力是整个系统的 “认知地基”。地基越扎实,模型对真实世界的拟合精度与预测效能就越强,机器人的“大脑”做出正确决策的能力也就越强,其满足实际落地场景所需要的实机训练数据量就有可能减少。

所以,世界模型和具身智能今天虽然被频繁地放在同一个句子里,但它们其实处在两条不同的时间轴上。

世界模型的目标,首先是用来自整个互联网的视频与图像信息去理解、预测乃至生成整个物理世界,它更像通用大模型的下一站:数据胃口以百万小时计,技术阶段上则更类似当年ChatGPT刚出现时的大语言模型,模型架构仍在快速迭代,尚未收敛。

而具身智能的核心诉求,则是让机器人完成具体任务——倒水、装配、擦桌子。现阶段的技术成熟度大约相当于2016年的自动驾驶:硬件基本可用,算法的“大脑”仍需大量工程打磨。

换句话说,世界模型是“认知地基”,需要海量通用视觉数据来夯实;具身智能是“上层建筑”,依赖少量高成本的真机数据来精雕细琢。地基越深,未来楼房可以盖得越高,但地基的混凝土并不来自楼房本身,二者互补却并不同步,一边向下深挖,一边向上搭建。

“地基”夯实尚需时日,“样板间”暴涨是否为时过早?

比技术进展更吸睛的,是另一层面的消息:

此前,有消息称,智元机器人已通过“协议转让+要约收购”的方式拿下了材料供应商上纬新材63.62%股权。

从技术和供应链上来看,上纬新材的主打产品包括PEEK(聚醚醚酮)等轻量化复合材料,可让机器人外壳和关节减重30%以上;智元控股后,既是锁定关键材料供应,又能用机器人实测数据反向优化适配。

从资本视角看,在“具身智能”概念刚刚兴起,领头企业尚且稀缺的A股,智元在借壳上纬新材之后,如今似乎又开始给投资人一个“机器人大脑”来标的。

自7月8日公告以来,上纬新材股价从30亿元市值最高冲到400多亿元,走出11个“20cm”涨停,智元还没把世界模型和具身只能真正落地到工厂,其市值杠杆却被放大到了资本市场。

由此来看,世界模型能不能让机器人“长脑子”尚且未有定论,但股民却在这之前就已经被“点燃”。

数据飞轮、模型瓶颈、合成数据、仿真+真机混合、大模型互联网、分层过渡,种种技术路线上还笼罩着挥之不去的迷雾,而资本却硬生生在这个时候给具身智能领域打上了第三根坐标轴——能否证券化。

智元通过控股上纬新材,把“地基”和“楼房”打包成可交易资产包;其余五派仍停留在技术PPT阶段。当技术路线尚未收敛、Benchmark尚未统一时,资本抢先定价,行业被提前拖入“市梦率”博弈。

现在的情况下,其实可以从对待世界模型的态度分出两派:

•数据飞轮派(智元-姚卯青):开源1000万条真机轨迹,一起把飞轮转起来。

•模型瓶颈派(宇树-王兴兴):硬件够用、数据够多也白搭,架构必须推倒重来。

二级市场用10倍涨幅给“飞轮”投了票,但技术层面,仍无人能具现王兴兴提出的“原生具身大模型”。

智元把GE开源,是一次漂亮的科普;控股上纬新材,是一次成功的资本运作。样板间已搭好,地基仍在打桩,而参观队伍里,一半是工程师,一半是交易员。

世界模型2-5年才能跑出的Benchmark,资本市场2-5天就给出了估值。到底是世界模型成就了机器人,还是机器人概念成就了市值?

答案会写在下一版Benchmark和下一季报里。

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10