10月17日,一场名为《点亮科技花火,共创智能未来》的论坛在深圳举办,在这个论坛中,关于AI大脑——离身智能的讨论热烈展开。
一个能灵活行走、精准抓取的机器人,若没有理解环境、预判需求的高级认知能力,其价值是否始终有限?答案显而易见——单纯的物理动作执行只是机器人的“躯壳”,无法突破机械重复的服务边界。
离身智能对话发起人、云迹科技研发中心龚汉越给出了破局方向:“因为服务机器人服务的本体是人类,要让人类更幸福,就要和人类一样,在开放的世界中,去追求更高阶的智能。”
真正赋予机器人“灵魂”的,正是与其身体分离、能持续进化的AI大脑(离身智能)。这一核心逻辑,让云迹科技跳出“硬件迭代”的局限,推动机器人从冰冷的自动化工具,向能感知、会思考、可进化的“场景智能体”转变,践行其“机器人,让人类更幸福”的使命。
从“躯壳”到会呼吸的“生命体”
什么是离身智能?离身智能(Disembodied Intelligence)是指不依赖于物理身体的人工智能系统。这种类型的智能通常以软件形式存在,运行在服务器、云平台或个人设备上,并通过网络接口与用户进行交互。
中国科学院院士张钹曾指出,图灵早预见的“离身智能”路径,正通过大模型突破实现规模化落地——这类依赖纯数据推理的智能形态,可脱离具体硬件载体存在。
图片
龚汉越在分享中,描绘了智能体从“单一任务模型”到“开放世界持续演进”的技术路径。他指出,未来的智能体不应是一个静止的程式,而是一个“会呼吸的智能体”。这意味着它将不再局限于预设的封闭场景,而是能像生命体一样,在真实的开放环境中,通过与人和环境的持续交互来“呼吸”数据、“学习”新知、“适应”变化,最终实现与物理世界的共同演进。
对于大众来说,云迹科技是以具身智能见长,事实也是如此。根据弗若斯特沙利文报告,按2024年计,云迹科技在三维多层空间同时在线机器人数量和服务终端消费者数量为全球最大,同时在线机器人数量单日最高达3.6万台。
图片
云迹科技登上弗若斯特沙利文AI Agent三项榜单
事实上,云迹科技的AI数字化系统,即离身智能也很强大。作为酒店场景的“数字化运营大脑”和离身智能中枢,云迹科技HDOS(Hospitality Digital Operation System,AI数字化系统)在酒店场景中取得的成效,已直接转化为强劲的财务表现:被视作“第二曲线”的AI数字化系统业务展现出强大爆发力,其在2022-2024三年间的复合增长率高达45.5%,而2025年前5个月,智能体应用收入的同比增速更是达到194%。
从“躯壳”到会呼吸的“生命体”,离身智能的核心在于它不需要绑定特定的物理载体来感知世界或执行任务,而是通过数据处理和算法来进行认知和决策。 龚汉越用“一岁女儿海边度假,铲沙子‘品尝’,发现不好吃就继续玩耍”的例子来说明智能的本质是:我们体验意外,在偏差中修正认知,并持续优化行为。
开放世界的复杂性远超预训练能力所能覆盖。然而,面对开放的物理世界,AI仍需持续学习。云迹科技的机器人服务应用于人类真实的开放物理世界中,在与人类一同在该环境中持续学习,追求更高级的智能。
龚汉越认为,离身智能不应止步于状态理解与资源调度,而需真正理解开放世界并做出准确判断。因此双驱动学习模式是一个解法:一方面完善现有预训练模型,另一方面建立基于交互的持续学习系统。在学习方式、资源来源与改进机制上实现有效结合。
在追求离身智能的道路上,云迹科技强调三大方向:开放强化学习以优化自主决策、持续学习以应对遗忘挑战、舰队集群学习以提升获取的数据价值。
从“看懂”世界到“规划”行动
从VLM(视觉语言模型)到VLA(视觉语言动作模型)的跨越,本质是机器人从“感知智能”迈向“决策智能”的关键跃迁。这一进程的核心驱动力,正是数据规模与多样性的指数级增长。
正如谷歌DeepMind CEO Demis Hassabis在2025年深度访谈中所言:“任何在自然界中能够生成或发现的模式,都可以被经典学习算法高效地发现和建模,而这一切的前提是拥有足量且多元的数据”。
云迹科技正好“拥有足量且多元的”需求信息。根据弗若斯特沙利文报告,云迹科技在酒店场景中市占率达13.9%,高于第二至五名总和。截至目前,累计服务超过3.4万个企业客户,包括超3.4万家酒店及150+家医院。
当训练数据从互联网级图文扩展到包含机器人操作轨迹的多模态数据集,模型才能真正学会将“看懂”与“行动”无缝衔接。
HDOS系统是云迹科技基于“AI+具身智能”技术构建的行业首批服务智能体应用系统。它通过全链路闭环工作流与多设备生态互联,从“看懂”场景到“规划”行动,实现线下服务场景与线上数字能力的深度融合。
图片
“看懂”世界依赖双模态感知引擎:通过视觉识别酒店门牌号、电梯按钮等空间标识,结合语音交互理解“送水到302房”等需求,这源于全球3.4万家酒店的场景信息抓取及反馈——累计5亿次服务生成的环境特征库,让机器人能适配不同光照、动线的复杂场景。HDOS 还可联动监控图像识别异常,如医院走廊的物资遗落,实现从被动响应到主动感知的升级。 “规划”行动则依托群体智能调度:当接收到多任务请求时,系统会优先分配就近机器人,规划最优路径避开客流高峰,例如酒店机器人送物时同步触发客房清洁工单。这种决策能力来自单日最高3.6万台机器人同时在线的实时数据反馈。单月执行超过186亿次指令的轨迹数据,持续优化任务拆解与资源协调算法。在跨场景迁移中,酒店场景训练的路径规划模型经医疗数据微调,即可精准完成医院标本转运。
正如HDOS构建的“感知-认知-决策-执行-反馈”闭环所示,其每一次行动优化都源于海量真实需求信息的喂养,这正是从“看懂”迈向“规划”的核心密码。
我们正迈入机器人主动交互新时代
在中国科学院自动化研究所副总工程师、中科紫东太初(北京)科技有限公司董事长王金桥看来,我们正迈向一个复合多态机器人具备主动交互能力的新时代。
王金桥认为,以时间阶段进行划分,整个智能阶段分为五个阶段:2020年至2023年是大语言智能阶段;2023年至2025年是多模态智能阶段;2025年至2027年将进入具身智能与群体智能阶段;2028年至2032年将是融合增强智能阶段;2032年至2035年,智能系统将实现自主规划,具备与人相似的环境交互与学习能力,并拥有自我进化的潜力。
在具身智能与群体智能阶段,需要机器人和AI系统的深度融合。作为中国机器人服务智能体领军企业,云迹科技开创性地构建了"具身智能(机器人)+离身智能(AI系统)"双引擎驱动的智能服务生态,并率先实现从环境感知、意图认知、智能决策到自主执行、闭环反馈的全链路AI智能化,打造了业界首个完整落地的服务智能体生态系统。
明略科技创始人、CEO兼CTO吴明辉特别强调,AI公司的发展要有“自主模型”,他说,在实际应用中,可能只有个别复杂任务才会用大模型,而大部分任务都是采用小模型。“未来全世界不应该只有一种机器人,也不应该只有一种模型。”吴明辉说。
影刀创始人、CEO 金礼剑说,他们目前正将规则明确、基于电脑操作的办公任务自动化,从而解放员工的双手。“我们今天所做的一切——研发机器人、推进AI项目——本质上都是为了人类不必再如机器般工作,不再被困于枯燥重复的任务中。我们可以更专注于成为真正的人:品德高尚、情感丰富、对社会有贡献。那些严格、重复、规则化的工作,应该交给机器人完成。让机器做机器该做的事,让人成为真正的人。”
正如OpenAI CEO山姆・奥特曼强调的,AI基础设施的完善将催生服务化浪潮,其“星际之门”计划正构建能支撑全球调用的智能底座,这恰是离身智能普及的核心前提。未来,离身智能的能力将如同水电煤一样,成为一种可被各类机器人终端随时调用的基础服务,驱动整个物理世界的智能化升级。
图片
龚汉越在论坛上描述的场景似乎充满了隐喻:机器人打开电梯门的一瞬间,它似乎感到“震惊”,因为它从未见过这样的场景——究竟是货中站了人,还是人外堆满货?
开始,机器人以为,这是人类某种神秘仪式;后来,它完成了场景含义的思考,它就开始了改变世界的行动。