基于不断提升的大模型能力,智能体(Agent)成为今年大模型领域各家最关注的方向。
今年,腾讯首次完整阐述了腾讯云的大模型战略,即通过“四个加速”:加速大模型创新、加速智能体(Agent)应用、加速知识库建设、加速基础设施升级。值得注意的是,这是腾讯在基础模型之外,首次提到Agent(智能体)。
近期,腾讯云大模型知识引擎已经全面升级为“腾讯云智能体开发平台”。基于腾讯云智能体开发平台,用户可以让Agent自主拆解任务和规划路径,主动选择和调用工具。
腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声在近期接受包括《中国经营报》在内的媒体记者采访时,回应了关于腾讯云智能体开发平台的诸多思考,并直言“每个行业都值得被智能体重构一遍”。
Agent正在快速演进
记者:Agent智能体与传统软件应用、SaaS有什么不同?
吴运声:Agent具备自主思考和决策能力。传统的软件开发范式(包括 SaaS)通常是开发者事先设计好流程,即使存在分支逻辑,也是开发者预先定义好的。但智能体面对的是自然语言交互,用户的输入是开放的,不可能穷举所有分支。这时就需要智能体能够自主理解、规划、执行任务,而不是依赖于固定流程。
同时,智能体能融合确定性工作流与自主规划机制。腾讯云智能体平台也支持工作流组件的融合。用户可以构建确定性的流程来处理特定任务,同时也允许智能体在其中进行自主规划。这样就实现了灵活性与确定性的结合,更好地满足复杂多样的企业应用场景。
记者:现在开发者社区里对 Agent 有很多争议,腾讯如何理解Agent?你们判断目前是否正处于 Agent 技术发展的一个关键路口?
吴运声:我只是从一个既做技术又做产品的从业者角度谈谈我的理解。在 to B 场景下,Agent 的本质是一种新的应用形态。它和传统软件最核心的区别在于,它具备自主规划能力,可以根据用户的自然语言指令,自主调用工具,甚至多个 Agent 协同完成一个复杂任务。这种范式和过去软件预设流程有本质不同。
从技术角度来看,我们会深入研究以下几个核心问题:如何实现更精准的自主规划与执行;如何实现多 Agent 协同的复杂任务处理;如何构建更高效的工具调用机制。
以工具调用技术的演进为例,它经历了Function Calling、ReAct 模式、Code Agent(CodeArts)几个发展阶段
举个例子:如果你要比较中国、日本、新加坡、德国的 iPhone 15 价格,使用Function Calling 技术就是一条条查;使用ReAct 模式,则会在每一步加上“我现在要查价格,我现在要调用汇率”;而 Code Agent 会直接生成一段程序,循环遍历各国数据、调用接口、换算汇率、返回结果——高效得多。
不论是应用范式还是底层技术,Agent 都在不断快速演进。
Agent不存在单一固定的技术路线
记者:腾讯云智能体开发平台的产品定位与价值是什么?
吴运声:我们提出“腾讯云智能体开发平台”,因为它融合了三方面能力:过去积累下来的强大的知识管理能力;支持复杂业务逻辑的工作流编排能力;智能体本身的自主感知与决策能力。
通过这些能力的整合,腾讯希望帮助企业真正用得起、用得好智能体,而不是停留在概念阶段。
在组织层面,坚持快速研发前沿技术,同时将技术与客户需求紧密结合,真正把 AI 能力应用在业务场景中。
记者:从腾讯内部来说,腾讯有个叫“元器”的产品,也是Agent类产品,和现在的腾讯云智能体开发平台是什么关系?
吴运声: “元器”是一个偏C端的产品,主要是跟“元宝”结合,用来为个人用户或轻量开发者提供智能体定制能力,也支持一键发布到元宝或QQ智能体中。
“腾讯云智能体开发平台”则是面向B端的企业级平台,强调的是系统性构建、数据接入、安全隔离、跨角色协作等复杂能力。
记者:从外部来看,今年很多厂商不约而同地在智能体领域加大投入,怎么看智能体市场发展趋势?以及各个大厂在技术路线上的选择?
吴运声:一是智能体技术快速发展,尤其是智能体具备自我规划和调用工具完成复杂任务的能力在不断增强。二是应用业务的发展需求随着技术提升也在增长,智能体能够更好地满足客户复杂多样的场景需求。这两方面共同推动了智能体的快速发展,成为一个自然且必然的趋势。
个人认为Agent开发目前还没有出现泾渭分明的路线。腾讯专注的是如何构建能力更强、更丰富的Agent应用,这需要调用多种已有能力和不同模型。个人认为不存在单一固定的技术路线。
怎么看市场未来发展
记者:目前智能体的应用已经涵盖了对内对外的信息检索与处理。从腾讯的视角看,还有哪些场景或者任务更适合用Agent来做?
吴运声:从C端用户的角度看,首先接触到一些比较典型的Agent任务,比如调研写报告、生成图片视频、执行指令类任务等,感受会比较直观。但从产品和技术人员的角度,其实更关注的是这些Agent背后的核心能力构建。
比如,我们把浏览器沙箱与浏览器工具集成到了腾讯云智能体开发平台中。因为我们发现,不管是办公还是生活场景,浏览器都是非常核心的交互工具。
如果Agent具备了使用浏览器的能力,那它的“行为边界”就大大拓展了,可以覆盖很多真实场景。这也是我们平台赋予开发者和客户“想象空间”的关键。
未来我们也在研发本地电脑的沙箱能力(Computer Use 插件),让Agent可以操作本地软件、编辑文档、调用工具,就像一个“虚拟操作员”。你设想一下,如果一个Agent不仅能上网、还能帮你打开Excel自动填报表格、用Photoshop批量裁剪图片,那它在企业内部的价值就会非常大。
记者:目前有哪些行业或场景最适合率先落地Agent应用?
吴运声:这个问题让我想起二三十年前,大家问“信息化最适合哪个行业”时的场景。其实现在回头看,当时任何确定性的回答都不太准确。因为每一个行业都有自身的复杂性和转型需求,真正能否落地还是取决于企业自身的理解和推动。
现在智能体的发展就像信息化起步的那个阶段,不是某个行业特别适合,而是“每个行业都值得重构一遍”。
只要企业业务复杂度高、知识密度强、人力成本高,Agent技术就有用武之地。关键在于业务人员和企业家如何理解Agent与自己场景的结合点。
记者:怎么看智能体在企业数字化转型过程中的增长趋势?在企业落地过程中,当前还有哪些现实挑战?
吴运声:“增长”这个词,个人比较少提。虽然从数据上看,智能体相关的业务增长幅度非常大,但那是因为起步阶段基数很低,目前正处在快速探索期,所以用“增长”来描述可能会有些误导。
我们更关注的是,智能体如何真正融入企业的业务流程,满足真实的业务需求。比如在快递行业的一个落地实践,就整合了多项技术能力:包括语音合成、数字人能力、语音 PaaS 平台、浏览器插件、多 Agent 协同等。这不是一个简单的“产品交付”,而是构建了一个高度可组合、可扩展的平台,企业可以在上面构建适配自己场景的复杂应用。
腾讯面临的挑战主要来自两个方面。首先在技术层面,目前的 Agent 框架仍在快速演进,尤其是在自主规划(planning)这个环节上,底层模型还不能100%把复杂任务完全准确地拆解并执行。这是模型和框架协同进化的问题。
其次是客户认知层面,很多客户还停留在对“Agent”作为一个新概念的理解阶段。但真正要用好 Agent,需要掌握它的使用方式、搭建方法和运行机制。这中间存在一个不小的“认知与使用”的鸿沟,需要通过产品体验优化、培训、服务等多种方式不断去弥合。
(文章来源:中国经营报)
免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。