大厂纷纷入局，百度、阿里、字节抢夺Agent话语权

蓝鲸财经

22 May

作者丨科技新知樱木

2025年5月，红杉资本AI峰会在旧金山落下帷幕，在这场包含Open AI创始人山姆·奥特曼以及谷歌首席科学家Jeff Dean等150位全球顶尖AI公司创始人、科学家以及投资人的大会中，一个共识逐渐被确立下来——即下一轮 AI，卖的不是工具，而是收益。这句看起来有些跳跃的话，红杉给出了一个模式性的解释，即未来AI将从卖工具到卖协作，最终走向卖成果（Software as an Outcome）。

如何从卖工具到卖结果，这场红杉的峰会更具落地的意义，也许在于强调了Agent的价值。随后，硅谷大厂开启了第一波加速，微软CEO纳德拉在主题演讲中宣布：“我们已经进入了AI Agent时代，正在见证AI系统如何以全新方式帮助我们解决问题。”Open AI CEO山姆·奥特曼宣布，推出面向开发者的新Codex 智能体，称“这可能是编程史上最大的变革。”

而在大洋这一端的国内市场，已经蠢蠢欲动的大厂们，似乎也有了相同的判断，从字节、百度、阿里的动作来看，头部互联网大厂纷纷加速布局Agent应用。据内部人士透露，字节已经有7个团队在竞速Agent，而百度在前不久的create大会中直接拿出了心响，声称其为直接可用的Agent。而在阿里一侧，夸克内部已经自我定位为“超级Agent”。

而除了通用Agent之外，各个大厂在垂类Agent方面也在不断加速。阿里飞猪问一问，百度旗下的法行宝等也在不断扩张。

Agent作为大模型之后的第二波确定性浪潮，已经开启了加速争夺，而最后影响战局的变量，除了各家的生态厚度，还有对于心智、用户习惯的占领。这也就意味着最终能够参战的，也许只剩下阿里与百度、字节、腾讯等少数玩家，而率先出牌的百度与阿里，能否抢得先机，值得一番拆解。

Agent爆发年，也是冲刺年

第一个叫醒大厂的，显然是Manus，这家由真格基金投资的国产Agent团队，在2025年3月初突然上线了Manus，从开启内测伊始，就赢得了全世界的关注。“10万元抢一内测码”、“一码难求”等热词刺激着人们的神经。主流观点第一次意识到，基于主流大模型的Agent居然能够实现如此强大的实操型功能应用与用户体验。而大厂的动作，似乎从那时起，就开启了加速。

字节是饱和攻击的代表。在晚点的报道之中，3月初，智能体应用Manus出圈前后，字节已有至少5个团队在开发不同智能体产品，其中有些是对内工具。而这一数字在4月底时，已经达到了7个团队。4月底，字节的flow团队拿出定位为 “用户与AIAgent协同办公的最佳场所”的扣子空间并开启内测，扣子基于自研的豆包大模型（如豆包1.5Pro）构建，支持 MCP（模型上下文协议）协议，可调用飞书多维表格、高德地图、图像工具等组件。

而百度的动作，也可以从李彦宏的发言中看出端倪。在4月的百度create大会之中，李彦宏直接表明“AI的终极价值在于应用落地，而智能体是连接模型能力与用户需求的核心载体”，就在大会期间，百度一口气拿出了通用智能体心响，同时宣布mcp全兼容。

而另一方面，阿里也没有放松，基础模型的优势，以及对夸克、钉钉的加码，让其在tob和toc端都有了竞争的实力。

从大模型的竞争，到Agent的竞争，大厂到底在角逐什么？简而言之，是技术加速后，交互方式的变化，对生态级别的入口争夺。

一个典型的类比，就是在大模型时代，当DeepSeek出现之后，由于其技术的领先性，没有花费任何营销费用，就轻松获取了庞大的用户量，而腾讯凭借着元宝对DeepSeek的链接，直接抢夺到了大模型时代的入场券。今天的Agent也是一样的逻辑，技术的底层已经成型，谁家的产品可以快速的成型，就意味着对市场碾压级别的领先。

在红杉分享会中，一个特殊的方向也被提到，即企业级市场中，真正先跑出来的入口未必是通用大模型，而是Harvey（法律）、Open Evidence（医疗）这类垂直领域智能体 OS，因为它们能听懂行业语言，理解真实需求。而对于这两个Agent，其中open evidence大家较为熟悉，投资人朱啸虎在多次访谈中提及，作为专为医生设计的AI诊断辅助工具，通过精准的临床支持和创新的商业模式，迅速在美国医生群体中普及。

所以可以看到的是，Agent的潜力不仅局限在某一两个应用上，更重要的则是生态级别的入口。而从这个角度来看，大厂无论是做智能体生态，垂直应用Agent，还是做通用Agent（心响、扣子，以及夸克）似乎都是必须要争夺的方向。

胜负手在哪儿？

“Manus能够成功，我们可以看到它用的是cloude3.5模型。”秘塔创始人在一档播客栏目中曾经评价到。从某种程度来说，这也意味着行业内的共识，最明显的例证来自于字节的扣子团队。

在晚点的报道中“扣子是个开放的平台，如果国内有大模型效果比豆包好，我们也会积极使用。”扣子团队开发扣子空间时，豆包深度思考模型还没发布，他们曾考虑优先使用DeepSeek-R1，测试后发现它调用工具的能力不够。

后来团队又对比六款国内大模型，使用了豆包1.5 Pro为主的多款模型。因为豆包在指令遵循、调用工具，以及多模态处理能力上表现最好，而且推理成本很低，能支撑大规模调用。

而这一观点，也被行业内广泛认同，拾象科技李广密曾在播客中坦言，预训练可能会重新变得重要，而大模型的能力也决定着Agent等能力。

从这个角度来看，百度、阿里与字节几乎可以说不分伯仲。百度拿下了与苹果的合作，从某种程度来说，苹果作为智能手机行业最大的入口，承认了百度在模型能方向上的能力。而阿里则拥有qwen这个可能是最优秀的开源大模型。对于字节来说，基于豆包大模型的产品长期霸占着c端下载量，实力也非常出众。而三方大量资源的倾注，让这场争夺愈发激烈。

当然，从Agent应用的角度来看，生态的厚度也是考量胜负手的关键。Agent的本质上其实就是能够“让 AI 真正实现自主完成任务”，而相关能够调用的应用的能力也是其能否赢得战役的关键。

这一点，几家大厂的选择似乎有所区别，百度开放了大模型和千帆开发平台兼容，地图、文库、网盘、Comate也开放了MCP Server。但字节则相对保守，更愿意自身成为全新的Agent工厂，阿里把所有都集合在夸克之中，超级框的概念，就是另一种能力上的调用。

而从行业从业者3月的一份数据来看，阿里的厚度优势明显。从该报告来看，国内调用较高的MCP Servers，包含了高德地图、notion、支付宝，以及minimax，而其中高德地图凭借着提供全场景覆盖的地图服务，包括地理编码、逆地理编码、IP定位、天气查询、骑行路径规划、步行路径规划、驾车路径规划成为被调用较高的APP。

当然，评价生态的厚度的变量还有很多，但可以看出的是，阿里的领先优势正在扩大。

从形态上来看，Agent仍然是一种社交，而从社交的视角来看，腾讯系则无疑占据着强大的优势。腾讯总裁刘炽平回应道：“在微信生态系统内，我认为我们有机会创造一个非常独特的Agent，即AI与微信生态系统特有的内容相连接，包括社交、通信和社区能力以及内容生态系统，比如公众号和视频号，以及数以百万计的小程序。实际上你可以接入各种信息，以及许多不同垂直应用程序的交易和操作能力。”

独一无二的社交生态，让腾讯特别是微信Agent也成为了不容忽视的力量。

此外，成本也是Agent能否完成蜕变的另一重关键。3月18日，The Information报道，Manus现阶段的产品同时受制于其服务器容量和高昂的运营成本。据两位直接了解情况的人士透露，Manus使用人工智能公司Anthropic的模型，平均每完成一项任务需向Anthropic支付2美元。

总结来看，基础模型能力、生态厚度、成本等都在成为Agent能否突出重围的关键，而从当下来看，这些变量的发酵暂时难以区分明显的优劣。

Agent还未到“GPT时刻”

尽管大厂的竞速与Manus等爆款产品的出现让Agent赛道热度飙升，但可以确认的是，当前行业似乎远未达到类似GPT的颠覆性临界点。从技术成熟度、商业模式落地到用户心智占领，Agent仍需跨越多重鸿沟。

一方面，当前Agent的核心能力仍高度依赖大模型，但模型本身存在显著局限性。CSDN博客指出，在处理多步骤任务时，大模型的规划能力容易崩溃，例如银行转账这类需十几步操作的流程，模型常因逻辑链断裂而失败。

同时，尽管大厂纷纷推出Agent平台，但生态整合仍处于碎片化状态，“各自为战”的局面导致工具调用接口不统一。不同Agent对其功能的调用方式差异显著，开发者需重复适配。

红杉峰会提出的“Software as an Outcome”理念虽被广泛认同，但落地路径仍不清晰。当前Agent主要以订阅制或按调用次数收费，本质上仍是工具思维。例如，Manus的高成本导致其难以向中小企业普及，而百度心响虽宣称直接可用，但企业用户更关注其能否真正提升销售转化率或降低运营成本。

此外，垂直领域的探索虽初现曙光，但规模化仍需时间。阿里飞猪问一问在旅游场景的表现可圈可点，百度法行宝在法律领域也积累了案例，但这些垂类Agent的行业渗透率仍然不高。用户对Agent的信任度尚未建立，尤其在涉及敏感数据的场景中，企业更倾向于保留人工审核环节。

当前Agent的用户体验呈现明显的两极分化。垂直场景如设计领域的Lovart，通过整合行业知识库和多模态输出，实现了“需求 - 交付”全闭环，设计师可直接基于其生成的分层文件进行迭代，效率提升数倍。但通用Agent如Manus，在处理复杂任务时仍显得笨拙——例如生成设计图时可能出现字体过小、元素堆砌等问题，用户需频繁手动调整。

更关键的是，用户对Agent的期待与实际能力存在落差。部分用户误认为Agent能完全替代人类，而实际上其在模糊指令解析、任务边界把控等方面仍需人工干预。

Agent的爆发印证了AI从技术到应用的跃迁，但距离真正的“GPT时刻”仍有漫长道路。

当前的竞争本质上是生态卡位与场景定义权的争夺，大厂的角逐布局似乎都在为未来的生态战争铺路。而决定最终胜负的，不仅是技术迭代速度，更是对行业痛点的理解深度与商业模式的创新勇气。当Agent能像水电煤一样融入日常生活，真正的变革才会到来。

晚点latepost《字节AI再创业：独立组织、全链条的饱和攻击》新皮层newthings《掌权一年半来，吴泳铭是如何管理阿里巴巴的》腾讯科技《微软一晚上发了50个新东西，要建一个Agent互联的“伊甸园”》AI深度研究员《只谈生存：AI Agent倒计时 730 天，硅谷 3 位“异见者”给出 3 条活路》AI深度研究员《红杉 AI 峰会闭门 6 小时，150 位创始人共识浮现：AI 不再卖工具，而是卖收益》中国企业家《AI新战场，腾讯押注Agent》

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Tiger Brokers

大厂纷纷入局，百度、阿里、字节抢夺Agent话语权

Most Discussed