GPT-5登场!OpenAI奥特曼:幻觉大幅降低,已从大学生变博士级专家

市场资讯
Aug 08, 2025

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:澎湃新闻)

千呼万唤始出来,GPT-5终登场。

8月8日,人工智能(AI)巨头OpenAI正式推出GPT-5。OpenAI CEO山姆·奥特曼(Sam Altman)称之为“进化”,“比任何以往的AI都更实用、更聪明、更迅捷、更人性化。”

山姆·奥特曼正式发布GPT-5

奥特曼用三个身份类比了OpenAI的三代模型:GPT-3像是高中生,偶有灵光闪现但常伴挫败感;GPT-4像大学生,具备真实智慧与实用价值;GPT-5则如同按需召唤各领域的博士级专家,随时助力达成目标。

奥特曼表示,GPT-5是OpenAI通往通用人工智能(AGI)道路的重要里程碑。

根据发布会所展示的,GPT-5在编程、数理逻辑、文本创作、健康咨询及视觉感知等多维度,整体智能水平相较前代产品实现跃升。

健康医疗领域,GPT-5可以通过动态适应用户背景、知识储备及地域特征,其提供的健康指导精准度与可靠性达到全新高度;文本创作能力也迎来提升,模型可将抽象概念转化为兼具文学性、情感共鸣与韵律节奏的优质内容;编程方面提升最大,刷新了OpenAI历代模型纪录,尤其在复杂前端架构生成与大型代码库调试环节表现突出。

GPT-5还推出了mini、nano以及pro版本

具体来看,GPT-5有几大突出亮点。

首先是幻觉显著降低。在启用网页搜索时,GPT-5响应的事实错误率较GPT-4o降低约45%;深度思考模式下,错误率较OpenAI o3降低近80%。

GPT-5在奉承和谄媚等方面也有了很大改善,回答的亲切感有所减弱,不必要的表情符号也更少。OpenAI表示,与其说是“与AI对话”,不如说更像是在与一位拥有博士级智力水平的朋友聊天。同时,GPT-5还引入了批判者(Cynic)、分析者(Robot)、倾听者(Listener)和书呆子(Nerd)四种“人格”供用户自由选择

同时,深度思考模式下也能更诚实地向用户传达其操作和能力了。GPT-5在处理不可能完成、具体要求不明确或缺少关键工具的任务时,不会为了获得高额奖励,“谎报”自己成功完成了任务或者对不确定的答案过于自信,而是更准确地识别任务无法完成的情况,并清晰地传达局限性。

GPT-5相较OpenAI o3幻觉显著降低

据OpenAI介绍,团队在GPT-5中引入了一种全新的安全训练形式——安全补全(safe completions),让模型在安全界限内尽可能给出最有帮助的答案,也就是部分回答用户的问题,或只提供高水平的回答。如果模型需要拒绝,GPT-5会经过训练,以透明的方式告知拒绝原因,并提供安全的合规替代方案。

GPT-5将取代GPT-4o、OpenAI o3、GPT-4.5等一系列旧模型,变成ChatGPT所有用户的默认模型。OpenAI还专门开发了一个路由系统,可以根据对话类型、复杂度、工具需求以及用户的明确意图(例如如果提示词中说到“认真思考一下”)自动切换版本,路由系统会根据真实信号持续训练,包括用户切换模型的时间、响应偏好率以及测量的正确率,并不断改进。

目前Plus、Pro、团队和免费用户均已接入,企业版与教育版用户预计将在一周内覆盖,免费用户将在数天内完成覆盖。

同时,Plus用户可在基础版GPT-5与具备深度推理能力的版本间切换,日常使用次数将多于免费用户;Pro用户则通过设置保留访问历史模型的权限,同时享有无限量GPT-5使用权及专属的GPT-5 Pro(专为高复杂度任务优化)入口;而免费用户在达到限额后,系统将自动切换至轻量化版本GPT-5 mini。

token定价方面,GPT-5为每百万输入token 1.25美元,每百万输出token 10美元,mini与nano版本价格较低。

GPT-5三版本API定价公布

根据近日OpenAI披露的数据,目前每周约有7亿人在使用ChatGPT。OpenAI此前预计今年营收将增加两倍以上,达127亿美元,明年将增长一倍以上,达294亿美元。

8月初,OpenAI由软银领投的400亿美元融资确定,公司估值达到约3000亿美元。据媒体报道,OpenAI目前正就一项可能的员工股票二次出售事宜进行谈判,公司估值有望达到约5000亿美元。

值得一提的是,奥特曼在发布会后又发文表示:“我们完全有能力发布更强大的模型(未来也必将发布),但GPT-5的特殊价值在于——全球超过十亿人将因此受益”。

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10