OpenAI史上最强ChatGPT智能体发布:逛网站、做PPT样样精通

IT之家
Jul 18, 2025

IT之家 7月18日消息,OpenAI今日凌晨宣布将在ChatGPT中推出一款通用型AI智能体,该公司表示该智能体可以帮助用户完成各种基于计算机的任务。

OpenAI介绍称,该智能体可以自动生成可编辑的演示文稿和幻灯片、查看用户的日历来简要介绍即将到来的客户会议、计划并购买制作家庭早餐的食材,以及运行代码等。

该工具名为ChatGPT agent,结合了OpenAI之前多种智能体工具的功能,包括Operator点击网站的能力,以及Deep Research从数十个网站中综合信息生成简洁研究报告的能力。OpenAI表示用户只需通过自然语言提示ChatGPT即可与该智能体进行交互。

为了开发这个新工具,OpenAI将其背后的Operator和Deep Research团队合并为一个统一的团队。外媒The Verge报道称,这个新团队由产品和研究部门共20~35人组成。

OpenAI今日起将向Pro、Plus和Team计划的订阅用户推出ChatGPT智能体,今年夏末向ChatGPT企业和教育用户开放。要激活该工具,用户可以在ChatGPT的工具下拉菜单中选择“智能体模式(agent mode)”。

OpenAI表示ChatGPT智能体比其之前的任何产品都要强大得多,可以访问ChatGPT连接器,允许用户连接像Gmail和GitHub这样的应用,智能体可以根据用户的提示找到相关信息。此外,OpenAI表示ChatGPT智能体可以访问终端,并可以使用API来访问某些应用。

根据OpenAI的说法,ChatGPT智能体的底层模型在多个基准测试中提供了最先进的性能。ChatGPT智能体模型在Humanity's Last Exam(pass@1)中得分率为41.6%,这是一项由数千个问题组成的、涵盖超过一百个学科的困难测试。这个分数大约是OpenAI o3和o4-mini得分的两倍

在已知最难的数学基准测试之一FrontierMath中,OpenAI表示,当ChatGPT智能体可以访问工具(IT之家注:如用于代码执行的终端)时,其得分为27.4%,之前的最佳分数来自o4-mini(得分仅为 6.3%)。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10