一个200美元的AI浏览器,想重新教会我“上网”

虎嗅APP
15 Jul

本文来自微信公众号:极客公园 (ID:geekpark),作者:张勇毅,编辑:靖宇,题图来自:AI生成

AI浏览器的战争开打到今天,从早期的Arc试图重塑交互,到Opera Neon展现的“代理”能力,再到传闻中OpenAI即将推出的浏览器,每一个行业重量级参与者,都在试图重新定义这个我们最熟悉的互联网入口。

本周,以AI搜索引擎著称的Perplexity终于带着他们的答案入场了——Comet,一款自称为“AI Agent原生”的浏览器

然而,Comet并没有在社交媒体上掀起足够的声量,因为Comet目前还处在仅向Perplexity Max订阅用户以及部分限定邀请码用户开放的阶段(每月订阅费200美元)。后续将通过候补名单(waitlist)的方式逐步扩大用户范围。

幸运的是,极客公园通过邀请码的方式,得以快速体验到Perplexity的这款AI Agent浏览器。

Perplexity CEO Aravind Srinivas对Comet的愿景野心勃勃:“我们构建Comet是为了让互联网做它一直渴望做的事情:放大我们的智能。”Comet的核心理念是“从浏览到思考”(From Browse to thinking)

听起来很宏大,但Comet究竟能给现有的浏览器使用体验带来什么?它与集成了AI能力的Dia浏览器,或即将拥有Gemini的Chrome有何不同?

凭借AI搜索起家的Perplexity,能凭借Comet将估值再推上新台阶吗?

一、什么是“思考伙伴”

要理解Comet的雄心与它目前的“最长板”,仍然需要从“Perplexity眼中的AI Agent浏览器用户需求是什么”出发。

如果说传统浏览器解决了“访问”信息的问题,那么Comet则试图解决“理解”和“运用”信息的难题。它认为,问题的根源在于,每一个标签页都是一个信息孤岛。而它的解决方案,就是将这些孤岛连接成一个拥有统一智能的大陆。

这个概念体现在Comet的方方面面;它不太像是一个传统的浏览器主页。更像是一部智能手机的桌面,布置着你所需的各种App。

Comet浏览器桌面|图片来源:极客公园

传统浏览器像是一座由无数个独立房间(标签页)组成的庞大建筑,每个房间都存放着不同的信息,你需要亲自跑遍每个房间去收集和整理。而Comet则试图将这座建筑改造成一个拥有统一中枢神经系统的智能体,你只需要站在大厅(Comet助手)里下达指令,这个智能体就会为你跑遍所有房间,带回你想要的一切。这是一种从“空间管理”到“智能委托”的范式转移。

Comet实现其宏大愿景的核心武器,是位于侧边栏的Comet助手(Comet Assistant)。它的魔力,源于两大能力的深度融合:一是超越单一页面的“情境感知”,二是类似我们此前已经在Manus AI看到过的、化信息为行动的“代理执行”。

这种体验不同于以往依赖单一网页信息读取实现AI效果的AI浏览器,Comet的这一能力,有潜力进一步改变我们处理复杂信息流的方式。

想象一下,你正在为购买一台新相机做功课。你的浏览器里打开了若干个标签页:电商网站的商品页面、专业摄影网站的深度评测、YouTube上的上手视频、一篇对比它与竞品的博客文章,以及一个论坛里关于它缺点的讨论帖。在传统工作流中,这势必是一场在不同页面间反复横跳、用大脑或笔记本来记录对比的艰苦战斗。

但在Comet中,这个流程被彻底重构了。

你可以直接向助手提问:“根据我打开的这几个页面,全面总结一下这款相机的优缺点。特别是,它和另一款竞品相比,在视频功能和操控性上各有什么不同?将结果用表格呈现。另外,那篇论坛帖子里用户抱怨的低光画质问题,专业评测网站是怎么看的?”

Comet助手此时扮演的,是一个顶级的专业助理角色|图片来源:极客公园

它能迅速阅读、理解所有页面的内容,包括视频字幕和论坛讨论,然后为你生成一份结构清晰、综合了各方观点的深度报告。这就是“情境感知”的力量,它将孤立的标签页整合为了一个统一的、动态的“浏览会话(Browse Session)”,这个会话就是它的记忆和工作空间。

我不再需要亲自浏览,而是让我的智能Agent代劳|图片来源:极客公园

这种能力不止于消费研究,真正大展身手的场合在于更加复杂的专业知识研究类工作。

假如你正在撰写一份市场分析报告,你的标签页里有一份PDF行业研究、一个Google Sheet数据表格和你的Google Docs报告草稿。你可以直接对Comet下达一系列连续Agent指令:“从那份PDF的第三章中,提取所有关于市场规模和增长率的关键数据,然后填充到我打开的Google Docs文稿中,生成三个核心的战略建议要点。”

在这条连续系列命令中,Comet Assistant能在生成对应的内容之后,以一种AI Agent的方式,帮我以正确的排版填充这份在线文档。

Comet助手能同时读取多个网页信息并操作|图片来源:极客公园

你当然也可以对它提进一步的要求:微调格式、进一步丰富细节,甚至是让它直接帮你想一个标题自动修改。

Comet能够通过同时监听并操作多个网页的方式,来完成更加复杂的任务请求|图片来源:极客公园

为了获取到更加无缝衔接的体验,Comet还会问你索取对应的日程与邮件读取权限,以便获得更加个人化的Agent辅助服务。

Comet在使用开始,就会向用户申请获取各种权限|图片来源:极客公园

除此之外,AI Agent也是Perplexity在Comet中加入的重要能力,Comet允许AI agent直接在本地浏览器执行任务(如批量网页操作、自动化表单、跨平台操作等),无需依赖云端虚拟环境,流程流畅且无需重复登录。

你可以直接向它提起需求,Comet就能自动理解并打开对应的网站,帮你修改个人信息,这就是一开始Comet为什么要索取不少敏感账号权限的原因——但你并不用担心数据泄露的风险,因为这些网页信息编辑操作都是基于本地处理运行。

在这里,Comet已经超越了信息的整合者,化身为工作流的执行者。它不仅帮你“看”,还帮你“做”。

Perplexity Comet最大卖点在于真正做到浏览器级自动化与深度AI集成,让“让AI真正替你上网、做事”成为新一代生产力工具的现实可用场景。

二、AI浏览器的“战略抉择”

从实际体验上来讲,Comet可以说是目前体验最完善的AI Agent浏览器之一,也是继Arc之后,又一次让我产生“将默认浏览器从Chrome切换过来”想法的浏览器。但这真的就意味着Comet能在AI浏览器的浪潮中最终存活下来吗?

面对AI浪潮,市面上的浏览器产品实际上选择了三条截然不同的演化路径。Comet的选择,决定了它的独特定位,也预示了它将面临的挑战。

最普遍和保守的路径,可以称之为“工具增强派”。以集成了Gemini的Chrome和集成了Copilot的Edge为代表,它们的核心逻辑是“浏览器+AI”。AI作为一个强大的新功能被集成进来,让你可以更方便地总结网页、润色文字。这很有用,但浏览器的基本形态和用户的使用习惯并未改变,AI只是一个更好用的新工具。

我们今天看到、Gemini在Chrome中的落地就是这一派的著名代表|图片来源:极客公园

更进一步的,是“代理执行派”。以一些探索性项目为代表,它们让AI能够根据用户的模糊意图,更主动地去操作浏览器,甚至在云端为用户生成报告或应用。在这里,AI的角色从“工具”升级到了“初级助理”,具备了一定的自主性。

而Comet所选择的,是第三条,也是最激进、最富想象力的道路——“环境重构派”。这条路上的探索者认为,在AI时代,AI不应只是浏览器的一个功能,浏览器本身就应该是一个AI环境。它们的目标是彻底重新定义浏览器的形态,将割裂的网页信息流,统一成连续的、可对话的、智能的交互环境。

Perplexity认为,随着人们越来越多地使用AI聊天机器人来获取信息,传统的搜索和浏览模式正在发生改变。Comet旨在抓住这一趋势,通过提供更高效、更智能的AI驱动体验来吸引用户。

因此,Comet坚定地选择成为“环境重构派”,这意味着它对用户的期望,不仅仅是“使用”它,更是“栖息”于其中。它希望用户能改变自己使用互联网的方式,将浏览器视为一个可以深度对话、可以全权委托任务的“思考伙伴”,而不仅仅是一个被动展示信息的窗口。

三、高昂的门票与用户“惯性”

然而,选择最激进的道路,也意味着将直面最陡峭的悬崖。

Comet的发布并非一帆风顺,其策略与理念,都让它陷入了创新者典型的窘境之中。

首先是引发了巨大争议的发布策略。目前,Comet的体验资格,仅对每月支付高达200美元的Perplexity Max订阅用户开放。这让大量每月支付20美元、作为其核心支持者的Pro用户感到了极大的失望甚至“被背叛”。

一位用户在社交媒体上的评论代表了很多人的心声:“完全的情绪过山车……我们以为Pro会是下一个。”虽然Perplexity官方承诺Comet在未来最终会对所有用户免费,但这道“200美元的门票”无疑在早期给它贴上了“精英主义”和“脱离群众”的标签,极大地限制了目前的口碑传播和早期用户生态的建立。

不少用户对 Comet 目前的测试策略表达了愤怒 | 图片来源:Twitter

而比价格争议更深层次的,是关于用户习惯的巨大挑战。The Browser Company在复盘其广受好评的Arc浏览器时,曾坦诚地承认,Arc之所以酷炫但未能实现大规模普及,核心原因在于它“太不同了,有太多新东西要学习,而回报太少”。

这便是AI浏览器界人人闻之色变的“Arc的教训”——它精准地指出了所有“重构派”产品面临的核心矛盾:做得太保守,用户没有理由放弃成熟的Chrome生态;做得太激进,用户则可能因为过高的学习成本,在真正体验到其价值之前就已放弃。

Comet正是这个矛盾的化身。它所提供的“会话式”浏览体验,虽然对某些用户来说可能意味着效率的指数级飞跃,但对于绝大多数习惯了Ctrl+T(新建标签页)、Ctrl+W(关闭标签页)和在标签页间跳跃的用户而言,无异于要求他们学习一种全新的“语言”。Comet必须用无可辩驳的、远超现有工具的价值,来证明这种学习是值得的。

在AI已经如水和电一般渗透到数字生活方方面面的今天,我们用了二十多年的浏览器,究竟应该是什么样子?它应该是一个集成更多AI功能的、更智能的工具?还是一个能彻底解放我们大脑、重塑信息关系的全新数字环境?

Perplexity用Comet给出了他们的答案:浏览器应该是一个能够“重新定义人与信息关系”的思考伙伴。从技术基础来看,Comet基于开源的Chromium项目开发,这意味着它天生就能兼容绝大多数Chrome扩展,保证了基础体验的稳定性和生态的延续性。这像是它为自己激进的革命理想,上的一道现实主义的“保险”。

但Comet的核心价值,绝不在于它对过去的兼容,而在于它对未来的定义。它所展现的,是下一代互联网入口的清晰雏形:一个前台交互简洁优雅,后台则由强大的AI理解上下文、串联信息、并能主动执行任务的智能环境

Comet的问世,与其说是一个产品的最终发布,不如说是一次大胆的、向整个行业和所有用户发出的未来提问。

这条路能否走通,不仅取决于Perplexity自身的技术迭代速度和商业策略,更取决于我们——每一个被“标签页地狱”所困的用户——是否已经准备好,去迎接、去学习、去适应这种全新的信息交互方式。它就在那里,像一个来自未来的邀请。而我们是否愿意奋力一跃,去拥抱那个全新的世界,将决定这场宏大的浏览器革命,最终的走向。

Comet浏览器本身,Comet这个单词最常见的含义是名词,指代天文学上的彗星。

或许说明Perplexity希望这款浏览器能像一颗新星一样,在竞争激烈的浏览器市场中迅速崛起并受到瞩目。

但它也会像彗星一样“转瞬即逝”吗?

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com如对本稿件有异议或投诉,请联系tougao@huxiu.com

End

想涨知识 关注虎嗅视频号!

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10