GPT-5.6泄露了!

新智元
Yesterday

【新智元导读】最近,GPT-5.6泄露了!150万Token+神级极简UI,下月紧急上线,奥特曼的“超级智能体”要掀翻整个硅谷?6月AI大战,已经提前爆发了。

全网都在盼的OpenAI新模型——GPT-5.6,终于要来了!

距离GPT-5.5发布仅仅过去三周,就在昨天,整个AI圈开始疯转这个消息。

多名开发者在OpenAI的Codex后台日志中,赫然发现了一个尚未公布的神秘模型gpt-5.6,内部开发代号为 iris-alpha。

没错,这次依然是一次“手滑”,但透露出极其多的信号。

如果说,三周前的GPT-5.5,是OpenAI在编程领域的一大进步,那么这次,代号为 “iris-alpha” 的GPT-5.6,则是展示出一场强大的“暴力美学”升级。

内部代号曝光、150万上下文窗口实测跑通、零指令生成极简神级UI……显然,我们以为要等上大半年的GPT-5.6,以及传说中的GPT-5.6 Pro,即将在6月空降。

更可怕的是,这不仅仅是OpenAI一家在秀肌肉。Anthropic的Sonnet 4.8与Claude Mythos 1、谷歌的Gemini 3.5 Pro,甚至马斯克的Grok 5,全都在暗中蓄力,剑指6月。

这不再是单纯的“大模型迭代”,这是2026年AI领域最激烈的一场军备竞赛!

1

审美核爆

不仅是程序员,设计师也要失业?

这次,GPT-5.6在前端的突破,简直是彻头彻尾的质变。

长期以来,AI生成代码一直存在一个致命的痛点:“Slop”(泥浆/垃圾代码)。

大模型生成的后端逻辑往往非常出色,但一旦让它生成前端UI,出来的效果往往是一言难尽——充斥着繁杂臃肿的CSS、不协调的色彩搭配、公式化的“AI味”网格等等。

但这一切,在GPT-5.6面前被终结了。

科技博主Leo近日晒出了一张GPT-5.6生成的应用界面。

在这张截图中,GPT-5.6展现了被开发者称为封神的能力。

在完全没有给出详细prompt进行UI引导的默认状态下,GPT-5.6竟然自主生成了一款名为“Lumen Notes”的极简主义笔记应用程序。

它展现出了极其高阶的设计审美:

1. 成熟的网格布局:模块之间的间距控制达到了像素级的完美。

2. 克制的色彩哲学:放弃了早期AI喜欢用的高饱和度颜色,采用了淡紫色调的关键组件搭配,清晰的色彩编码标签让视觉焦点异常明确。

3. 字重分层与直观导航:字体大小、粗细的层次感极强,导航设计直观到不需要任何说明书。

“去Slop化(UI de-slopification)”——这是这次泄露中最让前端开发者感到震撼的词汇。

仅仅在10天前,Leo还在吐槽GPT-5.6的前端生成效果极差。仅仅一周之隔,效果就发生了天翻地覆的变化。

这种颠覆性的UI去Slop化效果,说明OpenAI正在集中算力,定向爆破前端代码生成的短板。

显然,他们正集中精准爆破被长期抱怨的一痛点。

以前,Claude 4.5的Artifacts之所以封神,是因为它能在对话中实时生成可预览的代码组件。而现在,GPT-5.6直接把审美水准拉到了同等段位。

不久以后,只等GPT-5.6接口一开,直接用它来生成高质量的商业级应用前端。

前端程序员会失业吗?也许不会。但那些缺乏顶级设计审美的人,在GPT-5.6面前,生存空间已经不多了。

2

让全网破防的“金丝雀”

1.5M上下文屠榜

GPT-5.6的身影,不是第一次出现了。

知名开发者Haider在日常审查Codex的路由日志时,敏锐地捕捉到——

在满屏指向gpt-5.5的调用记录中,赫然出现了一条明确映射为gpt-5.6的条目。

起初,Haider以为这只是OpenAI在做“金丝雀测试”时留下的一点痕迹,或者是某个系统Bug,因为它很快消失了。

但到了5月第二周,风向彻底变了。

上周,当开发者尝试在代码中强行指定调用gpt-5.6时,系统还会冷冰冰地弹出一个报错:“model is not supported”。

但在过去的几天里,多名嗅觉灵敏的开发者通过ChatGPT Pro的OAuth认证,在Codex环境中成功调用了尚未公布的GPT-5.6模型。

不仅跑通了,探针测试还显示,GPT-5.6的上下文窗口达到了惊人的1.5M tokens!

要知道,目前强大的GPT-5.5 API上下文窗口是1.05M tokens,而如果走Codex OAuth通道,更是被限制在区区400K。GPT-5.6直接将这个上限拉升了将近43%。

开发者在辅助工具OpenCode中的极限实测证实:当输入达到90万tokens时,模型依然对答如流,甚至突破1.05M的请求也能被完美接住。

在这些隐秘的测试对话中,新模型自曝:它运行在openai/gpt-5.6上,推理等级最高可设定为x high,并且支持极其迅捷的fast模式。

随后,爆料大神Leo也跳出来实锤:“GPT-5.6的研发已经全面推进,首批checkpoint在过去几天已经开始内部测试,预计下个月正式发布。”

伴随实锤而来的,是三个极具神秘色彩的内部测试代号:iris-alpha(鸢尾花)、ember-alpha(余烬)、beacon-alpha(灯塔)。

目前泄露的信息显示,这次OpenAI将采取 “双版本” 策略:标准版和GPT-5.6 Pro。

- 标准版主打多步骤推理能力的跃升;

- Pro版本则重点强化 “智能体” 工作流。

显然,奥特曼不要做一个只会聊天的对话框,他要做一个能接管你所有数字化生存空间的“超级智能体”。

Polymarket上更是用真金白银给出了态度:GPT-5.6在6月30日前发布的概率,已经飙升至85%以上。

3

GPT-5.6 Pro与三巨头混战

6月注定血流成河

如果说150万Token和神级UI是GPT-5.6的“外功”,那么它真正让人胆寒的“内功”,则是它在多步推理和智能体工作流上的升级。

一位接近OpenAI内部的研究人员泄露了一条重要信息:“为近期一项重大数学突破提供支持的那个底层模型,目前已经在OpenAI内部被广泛用作日常调试和技术工作的主力驱动。”

业内资深人士对此评价道:“版本号并不重要,重要的是OpenAI显然在内部将其作为日常调试工具使用。这通常是最明确的信号。当构建AI的工程师们都开始信任它,用于实际研发时,你就知道它的能力有了显著提升。”

显然,GPT-5.6的进化方向非常明确:不仅要追求benchmark分数,更要让用户在执行长线任务时更加丝滑,也就是Agent工作流的方向。

而且,不仅是GPT-5.6,根据最新的供应链和内部爆料,Anthropic和Google也准备在6月动手了。

显然,6月我们将迎来一波大模型的爆发。

Anthropic Claude Sonnet 4.8已经在Vertex AI后端列表中现身,代号“Conway”,主打持久化后台代理,专门针对企业级超长任务。

Google Gemini 3.5 Pro传闻同样定档6月,意图在多模态领域扳回一城。

三大前沿模型将在同一个月内硬碰硬。这个6月,是真正的一场大模型盛宴!

4

OpenAI大模型,迭代正在加速

在这场关于GPT-5.6的泄露狂欢中,有一个数据让人细思极恐:OpenAI的发布周期。

回顾一下GPT系列模型的时间线:

- GPT-5:2025年8月7日

- GPT-5.1:2025年11月12日 —— 间隔97天

- GPT-5.2:2025年12月11日 —— 间隔29天

- GPT-5.3-Codex:2026年2月5日 —— 间隔56天

- GPT-5.4:2026年3月5日 —— 间隔28天

- GPT-5.5:2026年4月23日 —— 间隔49天

- GPT-5.6:预计2026年6月初发布 —— 间隔约40天

几年前,从GPT-3到GPT-4,我们等了将近三年。从GPT-4到GPT-5,我们等了一年多。

而现在,OpenAI将模型的主力版本迭代周期,硬生生压缩到了30到45天!

可以看到,模型的发布周期正在恐怖地缩短。这背后不仅仅是算力的堆砌,更是强化学习循环和模型架构优化的质变。

“三款最前沿的基座模型将在同一个月内发布。如果你的智能体底层框架被硬编码死死绑定在单一供应商身上,那么6月份你会感受到什么叫痛不欲生。”

一位硅谷资深架构师在X上这样警告。

6月,AI圈的全球狂欢节,即将开幕。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10