过去一年,关于人形机器人到底应该“多像人”,行业内外已有不少讨论。但如果把“像人”进一步拆解,会发现这个问题远比想象中复杂。
有的机器人比如Ameca强调表情,能眨眼、能微笑;有的机器人比如Sophia追求形象,还被授予“公民”身份;而更激进的做法,是类似波兰知名的机器人公司Clone Robotics那样,试图复刻人类的肌肉与骨骼结构。这也引出一个根本性的问题:
我们连“机器人是否一定需要双腿”都还没有达成共识,为何有些机器人演进路径,却在“1:1复刻人类”这条路上走到极致?这是工程师的技术执念,是真实场景的刚需,还是为了讲一个更好听的资本故事?
本期腾讯科技《具身之路》直播,邀请了数字华夏研究院院长刘迅、同创伟业投资总监程建以及申万宏源证券机械分析师胡书捷共同探讨以下主题:人形机器人 1 : 1 复刻真人:技术执念、场景刚需,还是资本故事?
在国内,EX集团、数字华夏、松延动力等企业都在探索仿生机器人赛道,其中,EX集团于2013年成立,目前是新三板上市企业;松延动力完成数亿元A+轮融资,已研究出沉浸式交互的仿生机器人头。数字华夏成立于2024年4月,目前推出三类机器人载体:帅气风格的男性化机器人“夏起”,知性的女性机器人“夏澜”,以及可爱风的“星行侠”多胞胎IP系列,它们均搭载自研的“巨号平台”,探索在真实场景中如何与人互动、提供服务。
今年3月,数字华夏获得同创伟业数千万元天使轮融资。同创伟业在机器人领域已投资霞智科技、数字华夏、中科第五纪,覆盖商用机器人、仿人交互与具身智能等方向。在人形机器人领域,其投资策略侧重从上游核心部件切入,包括减速器、丝杠、关节等,同时也持续关注非人形形态在工业和仓储等场景的应用。
本期直播核心要点:
1、机器人是否需要“像人”,本质取决于场景需求:对老人陪护、教育导览等强调情绪交流的应用,“仿真”并非为了还原人类形貌,而是为打造低疲劳、高共鸣的人机交互。
2、仿人机器人当前主要沿两条技术路径推进:电机驱动,以及液压或气动驱动。电机路径以Sophia、数字华夏为代表,通过向量控制驱动数十块“面部肌肉”,实现表情与语言的拟人交互;气动驱动如Clone Robotics,更贴近生物结构,从肌肉骨骼层面全面仿生。它们一个面向可交付与落地,另一个聚焦未来式仿生体验。
3、在人形机器人感知、结构、运动和表情四大“拟人”技术中,感知拟人技术最成熟、表情拟人技术最复杂。表情拟人不仅要求电机驱动肌肉协同、还原口型,还要通过心智建模实现情绪表达,是当前最具系统性挑战的方向。
以下为本期直播精华内容整理:
胡书捷:回顾全球的一些典型案例,并对技术路线进行比较,可以看到仿生机器人已经成为全球共同的研发方向:比如海外的Ameca注重表情的精细表达,Sophia强调人形外观和公众形象,Clone Robotics则追求肌肉仿生;国内也有诸多探索者,比如今天的嘉宾数字华夏,以及大连的EX Robot。那么,从骨骼、肌肉到微表情,机器人需要复刻到什么程度才算“像人”?
刘迅:我先简单回顾一下几个典型代表。
Ameca是英国一个工程团队Engineered Arts做的,印象中他们主要是在上半身发力,特别是面部的传神表达。比如嘴型、眼部的自动化控制这些,他们做得比较精致。
Sophia相对来说诞生得更早一点,是2015年由汉森机器人团队开发的一个女性形象的机器人。她的重心也是在“脸”上,注重表情和微表情的表达,再加上一些端到端的AI对话能力。Sophia比较出圈的一个点,是她在2017年拿到了沙特阿拉伯的公民身份。
再来说Clone Robotics,这家公司会令很多人联想到《西部世界》这部剧,它的LOGO好像也和那部剧有点关联,我们也开玩笑叫它“僵尸机器人”。这家公司走的路线是很不同的:上肢采用气动驱动,身体骨骼采用液压系统,整体是在全仿生结构上追求“更像人”。
(从左到右:Engineered Arts旗下机器人Ameca,Hanson Robotics旗下机器人Sophia,波兰Clone Robotics机器人)
程建:在探索机器人“如何实现仿人化”的过程中,目前主要有两种技术路线。一种是电机驱动,以Sophia和数字华夏为代表;另一种则是液压和气动驱动,例如Clone Robotics和早期的波士顿动力。
电机驱动的原理是利用电机输出的向量控制,推动或牵拉机器人面部的40多块“肌肉”,从而生成各种表情,包括微表情。其具体实现方式可能是推杆式或牵拉式,核心在于通过机械结构来模拟肌肉组织的功能。
其实,人类对制造“像人”机器的尝试并非始于当下。据我查阅的资料,早在蒸汽机时代,人们就已着手探索这一领域。然而,由于当时技术条件的限制,许多设想未能真正实现,相关成果也鲜有流传。
胡书捷:也就是说,在“像人”这件事上,目前行业内部存在明显的技术分歧?
刘迅:我不觉得是分歧,更像是路径不同。我们选的是电机驱动这条路,它本质上是“电机智能”——基于绿色能源背景,走城市化、智能化路线。虽然还不能说完全成熟,但这条技术路径具备多端通用性,逻辑是清晰的。
在人形机器人里,电机智能可以支撑我们在“像人”这件事上实现表情和语言的能力。人是高度集成的生物,我们希望机器人也具备这种复合能力。
但像Clone Robotics,他们更像是在做生物动力系统。他们上肢用气动,骨骼结构用液压,目标是从结构层面全面仿生。这条路很硬核,技术天花板很高,但难度也大。我觉得他们现在做的是体验性探索,也许未来会打开一个新世界。
我是认可他们的方向的,但现在更现实的是看我们能不能在材料、结构、驱动这些方面突破,把液压真正工程化,这方面我们也在关注。而我们做表情这条线,既是技术驱动,也是业务驱动。市场确实需要可交互、能服务的“类人”机器人,这不是空谈。
程建:目前整个行业仍处于早期发展阶段,而表情、肌肉等仿人化技术更是处于探索的前沿。目前的技术路径尚未收敛,各种路线都值得尝试,每一种探索都具有重要意义。
以Clone Robotics为例,其采用液压和气动技术,而其他公司,包括数字华夏,大多采用电机驱动。电机驱动的优势在于控制更加精准、易于数字化,且精度较高,这为后续的智能化发展提供了便利。相比之下,液压和气动系统则显得较为复杂,控制难度大,调试成本高。因此,在产品落地方面,电机驱动更具现实性,开发速度也更快。
Clone Robotics所选择的液压和气动路线可能更偏向于实验性研发,其商业化周期可能会更长。
刘迅:波士顿动力本身就是一个典型案例,他们在去年正式从液压系统转向电驱动。对于我们这些学工科的人来说,几乎是看着他们的视频长大的。从最初的双足机器人,到类人形,再到四足机器狗,波士顿动力一步步走到了如今的人形机器人。
气动这条路确实很有想象力,比如柔性和结构控制,但它的问题在于精度和可控性。相比之下,电机的控制更精准,成本也更可控。虽然人形机器人整体系统很复杂,但电驱还是目前比较可行的路径。
胡书捷:两位都认为电驱在当前阶段是更可行的路线,而液压和气动更多是技术层面的探索。回到微表情这个点——刘总,你们现在在做很多面部表情的工作,你觉得这些仿人表情,在不同的场景里,有什么实际价值?
刘迅:人形机器人这个“具身智能”,我把它分成三块:运控智能、交互智能、业务智能。交互是最基础的,人类最早的沟通方式就是交互,语言是核心工具。
但语言不只有语音,它包括动作语言、表情语言,还有语音语言。甚至还有“神韵”,也就是表情传递出的情绪。这些维度综合起来,才构成完整的交互。
我们的目标是让机器人不只是“speech to speech”,而是“多模态”的交互能力,说话时要有肢体动作,有面部表情,有情绪状态。尤其是表情,它在情感共鸣上的作用很大。我们在机器人面部上加了几十个电机,用来还原这些细微的情绪变化——有些是主动表达,有些是被动反馈。
这背后不是单纯为了“像”,而是为了实现更顺畅的交互体验,有了这些能力,用户才不会感受到“恐怖谷效应”。
现在大家都在讲恐怖谷,就是你做得像人,但又不够自然,看起来反而怪。所以,我们强调“smooth”的交互体验,这才是“像人”的关键。
当然,有些场景比如工业作业,它对表情要求不高。但在一些安全、应急场景里,一个恰当的面部表情能在毫秒级内传达关键信息,这是语音做不到的。
所以我们认为表情语言不是可有可无的,而是一个不可或缺的技术点。这也是我们在表情交互这个方向上“出圈”的地方。
胡书捷:确实,情绪价值本身也是一种很重要的价值。程总怎么看?
程建:归根结底,是否需要表情和人形化,还是要看机器人的应用场景。
目前的机器人大致分为两类:一类是用于工业生产的,比如优必选的搬运机器人。在工厂场景中,机器人只需完成搬运任务即可,根本不需要表情,甚至不需要人形化。一个底盘加上机械臂,就能高效完成工作,任务完成后即可离开,无需与人进行情绪交流。
另一类是面向人类用户的,比如陪伴机器人或客服机器人。在这种场景下,“像人”变得至关重要。丰富的表情和微表情能够产生真正的情绪价值,从而更好地与人类用户互动。
以酒店的送餐机器人为例。如果它只是一个简单的桶状机器人,将物品送到你面前后,你拿完就会转身离开,不会与它有任何交流。但如果它是一个具有表情和神态的人形机器人,你可能会多看它一眼,甚至与它交谈几句。
因此,是否需要表情和人形化,从根本上取决于机器人的应用场景。如果机器人需要与人互动,那么它就必须“像人”;如果它只需要完成任务,那么人形化和表情就并非必要。
胡书捷:关于技术这块,我们说表情拟人、结构拟人、运动拟人、感知拟人——这些分别涉及哪些底层技术?在难度和技术成熟度上有什么差异?
刘迅:我简单拆一下。
第一是表情拟人。底层核心是电机控制,所有电机动作都要做到平滑、有节奏,才能还原出人的“神态”。比如微笑时嘴角怎么拉、嘴巴怎么张,都是一套控制模型。而且不仅是静态的模仿,更重要的是“个性感”——因为每个人的表情风格都不一样。
第二层,我们会用扩散模型来实现表情的自动生成。一句话或一个语音输入,就可以生成匹配的面部动作。这背后牵涉的是心智建模,每个角色要有自己的“性格档案”。比如一个老师说“请进”和一个前台说“请进”,表情应该完全不同。
第三个关键点,是要基于“心智性格”去绑定机器人的表情输出方式和频率。
所以,表情拟人其实涉及三个层级:底层是电机节奏控制,中层是模型自动生成,上层是基于“心智”的个性化驱动。
第二个是结构拟人,主要对应的是骨骼、肌肉、关节这些,如果走液压路线,确实要求非常高。但现在行业里其实并不强求这部分完全1:1仿人。大多数人形机器人,还是用电机驱动结构,只要形态上像人、动作上有胳膊腿就行,这是工程上的“够用”标准。
第三是运动拟人,这块非常关键。现在技术上一般用强化学习(RL)来做,从传统位置控制转向数据驱动。它分两层,一层是“基础运动”——像人一样走路、上下楼梯、跑步,这是必须具备的。另一层是“表演级动作”——比如跳跃、翻跟头,这要求结构稳定性和协同控制更强。目前最大挑战还在运动稳定性上。双足行走天然不稳定,但正因为它不稳定,才需要机器人去适应复杂环境,而不是让环境适配机器人。
第四是感知拟人。人靠五感交流,最核心的是视觉和听觉,机器人也是。视觉上我们用RGB和RGB-D相机;听觉上是语音识别。嗅觉和味觉现在也有人在做,比如模拟呼吸气体识别、食物成分检测,我们甚至做过“美食讲解员”机器人。但说到底,感知更多是为功能服务。比如视觉用于避障、识别、导航;语音用于控制和对话。
从成熟度上说,感知拟人是最成熟的,毕竟AI发展几十年了,图像、语音识别都非常成熟。
其次是运动拟人,现在很多企业已经能实现稳定的双足行走,我们自己也在不断优化走姿。结构拟人对精度要求没那么极端,只要满足功能需求就行。
表情拟人,是我们比较专注的方向。它的难点在于不仅要还原肌肉动作,还要做情绪表达,实现情感共鸣和交互自然。
我认为当前最难的还是运动,特别是双足运动。一旦这块稳定下来,整个人形机器人产业无论在技术上还是落地上都会迈大步。
程建:刘博士已经讲得很细致了,我再补充一点看法。
结构、运动、感知这些方面,其实更多是功能性的,且已经有了一定的产业基础。例如,结构部件可以借鉴汽车或自动化产业链,而感知传感器则很多来自自动驾驶领域,比如摄像头、激光雷达等。
不过,运动和表情是两大难点。尤其是表情能力,这一领域其实处于“技术无人区”,此前没有任何成熟的产业链为其提供支持。
如果表情不够“像人”,用户的直接反应就是“怪异”,那种“皮笑肉不笑”的感觉会产生“恐怖谷效应”。因为人脸表情并非由单个肌肉动作构成,而是由多个肌肉协同作用形成的动态组合,这种协调性非常难以实现。以前我们看动画片,没有使用面部捕捉技术时,表情总是让人觉得有些别扭。后来好莱坞采用面部动作捕捉技术,比如在《阿凡达》《阿丽塔》中,才真正解决了这一问题。归根结底,表情仅靠参数调节是难以实现的,必须通过系统性模拟。
因此,我们认为表情拟人化是难度最高的部分。要通过多个电机驱动数十块面部肌肉,精确控制向量输出,还要配合说话时的口型变化,整个协调过程极其复杂,工程难度非常高。
胡书捷:我简单做个小结:从骨骼结构到微表情,各种技术路线都在并行探索。目前来看,电机驱动的路径在技术可行性上更成熟一些。微表情在很多人机交互场景中具备真实价值,技术难度也不低。它不仅涉及机电系统,还需要软件模型,甚至是大模型的支持。可以说,这块的技术目前还比较空白,探索空间很大。
胡书捷:我们接下来进入场景维度的讨论。这个环节的问题比较直接:1:1仿真是真需求,还是演示秀?我们先探讨第一个问题,当前人形机器人涉及的迎宾、导览、陪护、表演等场景中,有多少是必须仿真的?
刘迅:首先,技术本身也是经验的积累,我们从小有机器人梦,这条路不只是技术,也是一种坚持。在这个过程中就会”烧钱“,而最该烧钱的地方是“场景”。
我们去年4月成立数字华夏时,定位很清晰——做交互领域,不做工业场景。
我们希望机器人是“面向人”的,要跟人打交道。而一旦面向人,就绕不开“恐怖谷效应”,简单说,就是人和机器人互动时的心理疲劳感。比如几年前的送餐机器人,桶状外形一开始挺新鲜,现在大家都不太愿意搭理了。
从生物角度来看,和人交互疲劳感最低的生物,还是人。那我们就要往“像人”这个方向去靠,这不只是长得像,更重要的是行为像。
我们团队内部会不断反思,比如我们 CEO 会说:“你模型指标都挺漂亮,但用起来还是不像人。”所以我们定义了一套交互标准,从H1到H5,第一是外观,人是感性的动物,第一眼的接受度非常重要;第二是能力,包括表情语言、动作语言、语音语言这三种交互方式。
再往上,是情感交互。比如一个眼神、一个微笑,让你觉得“它懂我”。这和我们对宠物的感情是一样的,猫狗不会说话,但能让你觉得被理解。这个“懂”,其实就是交互价值的体现。
当然,交互不只是“卖萌”。最终,我们还是要让机器人能完成一些真实的服务,体现出业务价值。一比一仿真,其实是为了让它能自然地融入人类社会。
胡书捷:其中哪些场景对仿真是刚需?
刘迅:几个比较明确的方向:展厅导览、教育陪伴、情感陪护,尤其是针对老人、小孩的家庭陪伴。这些场景中,情感交流是第一位的。比如陪护老人,提醒吃药,递水,甚至在他们情绪低落时讲讲笑话。不同的情绪反应,也需要不同的应对方式——有时倾听,有时逗乐。这些不是靠一个“笑脸”就能解决的,需要的是一个更完整的情绪感知和表达系统。最终还是得靠一整套情商模型和人工智能系统去支撑。
程建:确实,这些场景都非常需要“人”的参与感。在现实生活中,迎宾、导览、陪护等工作原本都是由真人完成的。例如,前台通常会安排颜值较高的服务人员,这充分说明了“颜值即生产力”。
再比如在机器人马拉松比赛中,即使有的机器人脑袋掉了,从功能角度来看依然可以奔跑到终点,但如果发生在人类场景中,这样的情况会让人感到惊恐。
因此,关键不在于是否做到完全的1:1还原,而在于综合考虑外观、表情、情绪模型等要素,营造出一个“让人接受”的交互体验。
胡书捷:就是说,重点是人机交互和大众的接受程度,只要能打动人,其实也不一定要完全复刻人类。
程建:对,没必要非得1:1。
胡书捷:那换个问法:如果机器人已经足够好用了,我们还需要它像人吗?
刘迅:要不要“像人”,还是得看场景。像程总说的,马拉松这种就限定了“人形”这个条件,如果不限定,猫猫狗狗机器人也能参赛。目前来看,我们仍然把机器人当工具,用来完成任务,只要任务完成得好,就没必要强求“像人”。
但如果场景需要“与人打交道”,那就得“像人”。举个例子,现在商场里很多曾经引入的导览机器人都退场了,原因是交互疲劳。一开始觉得新鲜,后面就没人搭理了。所以我们必须回到刚才说的根本——看场景。
程建:关键在于明确什么是“足够好用”。在工厂场景中,机器人只要能快速、精准地搬运货物,就达到了“好用”的标准。然而,在人与人之间的互动中,情绪价值才是核心。我们与他人交流时,不仅关注功能,更在意情绪的流动和共鸣。
比如,如果与一个“桶”形机器人交流,无论它功能多强大,都会让人感觉别扭。但与一只猫或狗相处,哪怕它们什么都不会说,人们依然会觉得它们“好用”,因为它们能够提供情感上的陪伴和慰藉。
因此,如果机器人的目标是提供情绪陪伴,那么“像人”就变得至关重要。
胡书捷:用全拟人路线做机器人,在资本界其实争议很大,比如最近朱啸虎也表达了保留态度,产业内也有不少回应。从同创伟业的视角来看,会更关注什么类型的人形机器人公司?更看重哪些性能?
程建:我们在机器人领域布局较早且广泛,其中许多并非人形设计,例如仓储搬运机器人或用于工厂生产的机器人,这些应用场景并不需要机器人具备人形外观。我曾在朋友圈提到“机器人何必像人”,当时还被一家上市公司的机器人负责人反驳。如今,我会对这一观点进行修正:我们确实也在关注人形机器人领域,但我们的策略是从上游核心零部件入手,比如减速器、丝杠、关节等。
我们坚信,机器人赛道是一个万亿级的新兴产业,全球都在加速布局——从特斯拉到Figure等公司都在积极推动,因此我们不能错过这一趋势。但与此同时,我们也认同朱啸虎的观点:必须找到切实可行的落地场景,机器人不能仅仅会翻跟头或打拳。最终,只有当人们愿意为其买单时,才能形成真正的商业回报。
例如,我们投资的一些核心零部件企业,本身就拥有成熟的市场,无需依赖人形机器人的规模化落地来实现盈利。如果人形机器人市场崛起,那将是它们的第二增长曲线,而非唯一的依赖。
胡书捷:所以你们更关注的是整个机器人产业链,而不是特定形态。
程建:对,我们是从场景出发。
胡书捷:那回到“1:1复刻”这件事,你怎么看它?是为了讲故事,还是有实际价值?
程建:可以从两个层面来分析。首先是机器的制造逻辑。人类制造设备时,通常会将复杂的运动拆解为简单的运动。例如,要从A点移动到B点,不一定非要用两足或四足行走,使用轮子往往更简单、可靠且成本更低。同理,飞机也没有被设计成扇动翅膀的形式,而是采用了螺旋桨或喷气推进,这就是“简化运动逻辑”的体现。
然而,人形机器人有其独特的优势。我们所处的环境大多是为人类设计的,到处是台阶、把手、扶梯等,这些场景轮式机器人往往难以应对。因此,设计成人形机器人是为了更好地适应人类社会的基础设施。虽然这未必是最优方案,但无疑是兼容性最强的方案之一。
最终,是否需要设计成人形,以及人形化到什么程度,还是要看具体的应用场景。如果机器人用于交互陪伴,那么“像人”就显得尤为重要;如果仅用于执行纯功能任务,那么人形化可能就并非必要。
胡书捷:对,投资角度确实是两条主线,一条是落地可行性,一条是技术空间、想象力。但这两者之间的矛盾,比如高风险高估值,怎么去做平衡?
程建:核心还是要回归场景和客户需求。以数字华夏为例,客户明确希望机器人应用于展厅、4S店、营业厅等场景,这种需求是客观且实际的。我们也清楚,第一版产品往往无法完美满足所有需求,但只要客户愿意买单,就说明产品与场景匹配。反之,在某些场景中,比如工厂搬运,使用AGV加上机械臂就已经足够,无需人形机器人。
人类进化为两足行走本就不易,许多哺乳动物至今仍以四足行走为主。尽管两足行走难度较大,但它解决了与人类社会环境的兼容性问题。因此,那些炫酷的机器人宣传片背后,其实经历了无数次的失败和摔倒。但这并不意味着方向错了,只是说明这一领域仍处于早期探索阶段。
胡书捷:我们在商业化路径上怎么考虑?虽然现在有一些需求,但整体还比较小众,市场不够大,同时研发投入又持续在烧,这时候如何保证资金的灵活运转?
刘迅:我们现在是产品和市场双轮驱动,一边做产品、一边做落地。B端或者B to C这些需求确实存在,我们会快速跟进,带动产品在场景中迭代,促进资金回流和技术演进。
其次,我们也强调财务可持续性。我们有技术先进性,同时产品的落地和市场能力也不弱。虽然在这里没有完全体现出来,但我们团队的市场推动力其实非常强。
这就形成两条路径,一条是靠市场收入,一条是继续融资来支持核心技术研发。我们之所以有信心,是因为人形机器人这个方向,它的本质是具有通用潜力的,它不仅可以无限演进,还有一个很大的优势是能适配人类社会既有的环境。
所以我们不是为了外形像人而做人形,而是因为它能自然嵌入人类社会的工作和生活系统,从而走向“类人协作者”的定位。
胡书捷:从资本视角看,也存在两种路线:一种是现实主义,看效率和工程性;一种是理想主义,看技术突破或想象空间。资本当下更偏向哪个方向?
程建:不同的资本有不同的观点和方向。有人追逐表演型机器人,有些机构则更看重其未来的想象空间。但如今已不再是仅凭PPT就能融资的时代,企业更多地通过视频展示来吸引投资,像众擎、宇树这样的机器人通过舞蹈、武术表演,展示出的效果确实炫酷。然而,我们总会问自己:这东西能用在哪里?客户是谁?他们是否愿意为此付费?我们始终保持着“内心火热、头脑冷静”的态度。
比如在展厅或营业厅放置一个机器人,客户确实会感受到“有它和没它”完全是两个层次。机器人本身就是一个关注焦点,它能够提升整个空间的科技感和交互氛围。
所以,我认为这并不矛盾。如果机器人的设计初衷是为了与人交互,那么它能否顺利完成交互任务才是关键。流畅的交互体验本身就是一种工程效率的体现。我们既要保持对未来的憧憬,也要脚踏实地;既要注重产品的落地,也要倾听客户的声音。
胡书捷:对,既要有好产品,也要有未来空间。最后一个问题是:你们怎么看当前行业的发展节奏?现在是在追求“能不能用”的阶段了吗?还是还在允许技术探索和想象力存在?什么时候才可能出现路线的收敛?
程建:目前具身机器人技术路径尚未收敛,但其进化速度极快。短短几个月间,技术状态已发生显著变化,AI的发展也是如此。因此,我们不能等到一切技术成熟才开始参与。行业处于早期阶段,产品不成熟是必然现象,而这正是我们布局的最佳时机。
回顾历史,火车刚问世时甚至跑不过马车,但从其发展前景来看,火车最终超越了马车。如今,我们看到机器人摔倒或零部件脱落,这些只是阶段性现象,无需过分担忧。投资不能等到一切都完美无缺才开始,而应提前半步进入。这是我们基于行业趋势做出的判断。
刘迅:客户的要求确实在提高,比如我们在某些场景能做到95分、100分,但换个环境可能只有85分、90分,但客户还是愿意接受。说明已经进入“能不能用”的阶段。
这一年内有两个标志性事件:一个是马斯克发布了Optimus Demo,让大家看到机械性能的高可能;另一个是宇树机器人上了春晚,让公众开始觉得机器人“能进生活”,拉近了距离。
所以我把这几年看作是人工智能的第三次爆发。第一次是2005到2012年的机器学习,第二次是2012到2022年的深度学习,现在是2022年后的大模型和具身智能时代。
目前技术还不成熟,那我们就需要创新。而创新就会伴随失败、伴随高投入。随着技术的不断演进,市场会越来越关注结果、关注ROI,容忍度也会逐步收紧。
我个人判断,2028年用户问题可以基本解决,2030年走入C端,2035年人形机器人将达到类似汽车那样的成熟状态。它会是汽车之后的下一代通用平台。
免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。