出品 | 虎嗅科技组
作者 | 宋思杭
编辑 | 苗正卿
头图 | 视觉中国
5月21日,在北京一家五星级酒店的宴会厅里,腾讯云AI产业应用峰会正在举行。会场入口处,一排混元大模型和智能体的互动展示吸引了络绎不绝的参观者。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生身着深灰色西装、浅蓝色衬衫出现在会场中央的演讲台上。他保持了一贯的沉稳风格,平静而有力地阐述着腾讯对AI的全面战略布局。
“AI持续落地,每个企业正在成为AI公司,每个人也将成为AI加持的’超级个体’。”汤道生开门见山地表示。而在加大AI投入力度方面,腾讯的做法可以说是相当激进,其打通了各业务条线与AI之间的壁垒,极大权限地对各业务开放了AI能力。
而“全面拥抱AI”,既是本场峰会的主题,同时也贯穿了腾讯2025年的全年战略重要。它正在影响着这家科技大厂的方方面面。在演讲中,汤道生还提出了大模型、智能体、知识库和基础设施”四个加速”的战略。其中,智能体则是极为重要的一种呈现形式。它所代表的是当大模型在国内走过三年时间,应用范式的迭代。
然而,究竟什么是智能体?这个定义在行业里似乎还不够清晰。
在大部分人的眼中,智能体是这样的——当你想打开软件订机票,或者查找、整理信息,统计一个excel表,不再需要打开不同软件app自己完成,而是告诉智能助手,它就能够自动帮你完成,最终帮你订好机票。就好像在媒体群访间,腾讯云副总裁吴运声对媒体打趣道,“我现在就很希望有一个智能体来替我回答你们的问题。”
从这个层面来理解,智能体的概念并不模糊。然而,目前之所以概念模糊,正是因为行业内存在诸多问题。
比如市面上的智能体,它们的能力范围、交互方式甚至底层架构都可能完全不同。这从而也导致用户对智能体的期望与实际能力之间存在巨大差距。有些智能体可能仅具备自然语言交互能力,有些智能体甚至只是一个简单的自动化工具,后者与过去的SaaS软件唯一的差异可能只是象征性地加了AI,实际上并没有自主思考从而改变用户与软件应用的交互方式,而这一点才是稚嫩体的核心。吴运声在现场对媒体表示,“真正的智能体需要有思考、规划和执行的能力”。
其次,目前的智能体最大的bug还不是会不会思考,而是能力边界的问题。因为前者已经有部分智能体做到了,但后者,想要真正突破能力边界,还要走很长的路。
因为用户往往期望智能体能像人类助手一样全能,但实际上智能体的能力边界受到权限、API接口、数据孤岛等多方面因素的限制。比如让智能体帮你订机票,它可能需要访问日历、联系人、支付系统,还需要与航空公司的系统对接。任何一个环节出现问题,整个任务都无法完成。但放大来讲,这并不只是 AI 时代存在的问题。从这一维度来看,真正能做到的智能体几乎为0。
在本次腾讯云AI峰会的会场上,智能体也成了大家讨论最激烈的话题。因为在此之前,无论是Manus,还是国内一众巨头和模型厂商推出的类Manus产品,一度把智能体推向了风口浪尖,使其成为热议的焦点。
以下是在腾讯云AI产业应用峰会现场与腾讯云副总裁、腾讯云智能负责人吴运声的对话内容:
Q:今天腾讯云推出了智能体开发平台,在这背后腾讯云有哪些思考?
吴运声:首先是从我自己从业者的感觉来讲,最近几年AI的发展非常迅速,大环境从技术到产品形态,到面对客户的需求,以及技术与客户需求的结合,这些变化非常重要。
我们一贯的理念是AI不是一个基座,它是要真正服务客户需求的,所以不管做技术做产品,我们都希望服务客户实际的场景,给客户带来价值,这是我们的宗旨。
过往我们提知识引擎,是因为我们观察到在大模型出来之后,企业知识的使用或者知识库能力对企业的构建起着非常重要的作用。所以我们最直接的用途是怎么用技术在知识挖掘上有更好的能力,在这一块我们积累了非常多的能力,今天我也介绍了相关能力,比如我们怎么在大 Excel表格里挖掘答案,在过去这是很难的。
Q:智能体与传统 SaaS 的本质差异?
吴运声:我认为最关键的区别在于:
一、智能体具备自主思考和决策能力。传统的软件开发范式(包括 SaaS)通常是开发者事先设计好流程,即使存在分支逻辑,也是开发者预先定义好的。但智能体面对的是自然语言交互,用户的输入是开放的,不可能穷举所有分支。这时就需要智能体能够自主理解、规划、执行任务,而不是依赖于固定流程。
二、智能体能融合确定性工作流与自主规划机制。我们的智能体平台也支持工作流组件的融合。用户可以构建确定性的流程来处理特定任务,同时也允许智能体在其中进行自主规划。这样就实现了灵活性与确定性的结合,更好地满足复杂多样的企业应用场景。
Q:最近一两个月,腾讯在视觉模型和多模态模型方面的发布节奏明显加快了。作为优图实验室的负责人,您能否从腾讯自身的行业观察和客户需求出发,谈谈为什么我们现在会加快这一块的技术发布和开源?背后有哪些战略或行业层面的考量?
吴运声:我们现在发布节奏加快,本质是客户需求在驱动我们不断优化技术堆栈。无论是视觉、多模态、文本还是智能体技术,它们其实并不是孤立演进的,而是彼此协同、共同支撑整个企业AI应用的落地。
举个例子,我们早期就有一个非常重要的产品——媒体AI中台,服务对象包括电视台、广告公司、内容平台等。很多客户有海量的媒资内容,尤其是视频内容,最常见的需求是:
• 快速检索视频中的某一段内容,例如 1990 年春晚中冯巩的小品;
• 将长视频进行自动切分、分类、打标签;
• 对视频内容生成摘要,便于理解和传播。
过去用传统 AI 技术实现这些能力的时候,其实效果并不理想。比如抽取关键词、生成摘要这类任务,对语言理解能力要求很高。传统模型对“第十一届三中全会”或“2008年北京奥运会”这种长实体的识别非常依赖词典或规则,扩展性很差。
但现在我们有了大模型,特别是多模态大模型,在语义理解、上下文建模、内容切分、标签生成等方面都有显著提升。比如:
• 大模型可以将不同语言表达的相似语义映射到同一个语义空间,从而实现更强的语义检索与比对;
• 视频理解也不再是单纯依赖视觉模型,而是视觉+文本多模态协同;
• 通过引入Agent+工作流机制,可以将整个内容理解与加工流程高度自动化、模块化地重构。
所以你会看到我们在视觉模型、多模态模型上的开源和产品化节奏会快很多。这不是单点能力的堆积,而是以客户需求为中心,把能力整合成“系统性解决方案”的过程。
总结来说,技术节奏的加快是被真实业务需求推动的。我们过去很多年的能力积累,现在正好借助大模型、Agent等最新范式重新激活,用更智能、更高效的方式去解决问题。
Q:从腾讯的角度看,在推动智能体落地过程中有哪些能力储备?又有哪些挑战正在面对?
吴运声:从储备来看,我们其实不是“为了智能体而智能体”,而是在智能体背后有深厚的基础能力作为支撑。
• 第一是知识管理能力:这是构建企业智能体的核心基础,企业的智能体最终还是要用企业自己的知识体系来提供服务。
• 第二是工作流的能力:尽管现在强调 Agent 的自主规划能力,但现实场景中,很多任务还是需要明确的业务流程。我们把传统的工作流能力和 Agent 能力融合起来,提出了一个很有代表性的创新——在工作流中引入“全局视野”的智能体节点。
传统的工作流是串行执行、节点独立,但我们现在让每一个节点在执行时,都可以和一个拥有全局上下文理解能力的智能体交互,从而在保持流程确定性的同时,也兼顾了智能体的灵活性。
至于挑战,主要有两个方面:
1. 技术层面:目前的 Agent 框架仍在快速演进,尤其是在自主规划(planning)这个环节上,底层模型还不能100%把复杂任务完全准确地拆解并执行。这是模型和框架协同进化的问题。
2. 客户认知层面:很多客户还停留在对“Agent”作为一个新概念的理解阶段。但真正要用好 Agent,需要掌握它的使用方式、搭建方法和运行机制。这中间存在一个不小的“认知与使用”的鸿沟,也需要我们通过产品体验优化、培训、服务等多种方式不断去弥合。
我们相信,随着模型能力增强 + 平台工具完善 + 企业认知提升,智能体将在更多行业场景中真正发挥价值。
Q:您怎么看当前AI应用的发展趋势?是否觉得智能体是最有前途的方向?因为现在大家似乎都在做智能体。
吴运声:说智能体是AI应用里最有前途的,这个说法其实比较模糊。AI在很多领域都有广泛应用,智能体确实发展迅速,且智能体技术本身就是基于大模型。
很多企业使用的大模型技术,是不是算作用智能体,其实界限没有那么分明。智能体和大模型是互相促进的关系。智能体依赖于大模型的发展,特别是在模型理解任务、自主规划和调用工具等能力上的进步。
所以我认为AI的发展是全方位的,不仅包括大语言模型、多模态模型,还有语音模型、视觉模型等一系列模型的进步。智能体是其中一个非常重要的方向。
Q:在腾讯整体的AI生态里,智能体开发平台处于什么样的位置?它如何与腾讯其他AI产品联动?
吴运声:智能体开发平台的定位是为客户搭建更强大、更复杂的智能体应用。我们在做这个平台时,天然会整合腾讯过去积累的各类AI能力,比如端到端的语音识别和交互能力。以刚才演示的寄快递场景为例,语音通话能力贯穿始终,这正是我们以前积累的优势。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.