特斯联邵岭:以多模态统一空间模型打造空间智能

市场资讯
20 Jun

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

当前,大模型技术正通过架构革新与多模态融合,重构空间智能发展的底层逻辑,推动其从实验室走向产业化应用。传统的人工智能方法关注处理结构化数据和遵循预定义的规则。然而,空间智能的出现就是为了处理物理世界因多样性、复杂性导致的更为细致的空间推理。通过空间智能,机器可以用类人的方式与周边环境进行3D立体互动,并进行解读;无可争议的是深度学习模型已在各种计算机视觉任务中有了很多出众的表现,但其面临的挑战,例如,怎样集成多种数据类型并同时执行复杂任务就显得尤为突出。

我们与特斯联国际总裁、特斯联首席科学家、AI Lab负责人邵岭博士,就空间智能及衍生话题,诸如多模态数据融合等进行了探讨。

特斯联国际总裁、特斯联首席科学家、AI Lab负责人邵岭博士

邵岭博士在人工智能领域有着数十年的前沿探索经验。他表示,空间智能是人工智能和三维世界交互的能力,它通过感知、导航、操作、推理和环境生成等多种形式展现,并依赖于计算机视觉、深度学习、三维表示学习、多模态学习等多种算法和技术来实现,而特斯联正在将所有的模态数据统一到同一个语义空间,结合大模型的预训练和强化学习技术,研发与用户场景对齐的多模态融合空间智能大模型,并打造类人思考、长期记忆、个性化的AI智能体。

空间智能的实现依赖于多种算法以及包括计算机视觉、机器学习和机器人学等领域的技术。比如,空间智能的感知能力依赖于计算机视觉和深度学习,这是空间智能的基础;空间理解方面,为了理解三维结构,AI模型需要处理三维数据,依赖于三维表示学习来学习物体的几何和拓扑结构;在空间智能的推理方面,为了理解图像中的语义和空间上下文,并进行空间推理,需要利用视觉-语言模型(VLMs),强化学习(RL)技术;空间智能的执行能力则依赖于具身智能和环境模拟,在模拟的三维环境中训练AI智能体,使其能够学习导航和与环境交互。

邵岭博士表示,空间智能是人工智能和三维世界交互的能力,它通过感知、导航、操作、推理和环境生成等多种形式展现,并依赖于计算机视觉、深度学习、三维表示学习、多模态学习等多种算法和技术来实现。在这些技术中,有的技术已经发展多年相对成熟,有的学术和产业界才刚刚开展研究,还需要更多时间共同推进和突破。

他透露,特斯联在计算机视觉和深度学习、视觉-语言模型、强化学习、3D仿真、环境模拟等技术领域有多年的研发经验和技术积累,相关技术已应用于多个项目、解决方案和产品中。此外,依赖在行业数据理解、数据处理及多模态领域多年的研发经验,他说,“我们正在研发AIoT领域的多模态空间智能大模型,融合多种端侧设备采集的多源异构数据,具有强大的空间感知、环境理解和因果推理能力,能够直接从传感器数据生成控制指令,从而实现更智能、更高效的场景决策和执行方案。”

恰如吴志强院士所提到的,“智能的未来,不属于一个中心。它属于多重大脑、多类代理、多元视角的协同网络。”邵岭博士强调,如同在自然界一般,真正的智慧在多样性与分布性中繁衍,AIoT基因则使特斯联在多模态数据的采集沉淀、软硬件一体化、场景理解、生态系统构建等层面积累了一定的先发优势。

他透露,特斯联广泛部署的AIoT端侧设备,为获取海量、多样化、细粒度的时空数据提供了有力支持,能有效减轻空间智能发展中的数据不足问题。一方面,部署在不同位置和空间的AIoT端侧设备能够捕捉到细致、实时、全方位的环境信息;另一方面,覆盖多个区域和不同应用场景的设备得以收集到更具多样性的数据,这种多样性有助于空间智能模型的鲁棒性和泛化性。目前,基于端侧AIoT产品,特斯联已有能力采集、分析文本、视觉(图像、视频)、声音、环境(温度、湿度、光照、气压等)、位置(GIS坐标)、生物、电信号等数十种模态的数据。

同时,特斯联也在利用动态自适应时序同步技术实现不同模态数据之间的对齐——将所有的模态数据统一到同一个语义空间,结合大模型的预训练和强化学习技术,打造与用户场景对齐的多模态融合空间智能大模型。

特斯联国际的下一步研发计划,以满足中东和海外市场需求为目标,基于前期在行业市场中积累的数据、经验和技术,打造系列专用的AI智能体,进一步增强中国产品和解决方案在海外市场中的价值和竞争力——这包括研发面向移动终端(智能可穿戴设备、机器人等)的智能体HALI,以及应用于智慧建筑、智慧园区和智慧能源的空间智能技术等。

短期内,研发用于移动终端的AI智能体(HALI),为智能可穿戴设备和机器人等产品构建类人思考、长期记忆、个性化等核心能力,进一步提高这些产品的交互能力和智能水平,为个人和企业用户带来更高价值。

长期内,从专用的AI智能体出发,逐步向通用智能体方向发展。探索高维空间智能、自主学习、及多智能体等核心技术,实现智能体对复杂行为和意图的高级空间感知、理解和预测能力,并将这些技术能力应用于广泛场景,进一步扩大中国科技在全球产业链中的优势。

(免责声明:投资有风险,请谨慎投资。该文稿不代表中国基金报观点,不构成任何投资建议。)

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10