GPT-4时代,落幕了!它将被GPT-4o完全取代。而下周,我们也极有可能迎来GPT-4.1、o3满血版以及o4-mini这些新模型。大模型进化史,再次迎来关键节点。
猝不及防地,GPT-4就这样退出历史舞台了。
4月10日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。
从4月30日起,GPT-4将被当前的默认模型GPT-4o完全取代。
当然,怀念GPT-4的用户们也不必悲伤,它仍然可以通过OpenAI API继续使用。
不过,在GPT-4退役之前,人们的注意力很可能就会转向ChatGPT的新模型。
如今各种爆料已经传得漫天飞,据说,GPT-4.1(包括GPT-4.1-mini、GPT-4.1-nano和GPT-4.1),去年12月宣布的o3 「推理」模型,以及o4-mini全新推理模型都要来了。
遥想2023年3月14日,GPT-4正式发布,席卷全球,在全球掀起滔天巨浪,然后在两年内,引爆了全球AI大模型的寒武纪大爆发。
它的出现,开启了一个全新的时代,见证了一场技术井喷的大爆发,铺垫了后续无数OpenAI大模型的繁荣。
如今,这座灯塔终于要退出了。
Perplexity CEO Aravind Srinivas最近表示,AI的进步已经跨越了临界点——三个月的时间,仿佛就已经跳过了一章历史。
「我们应该期待,在今年剩余的时间里,变化会来得更快。」
的确,就在过去短短三个月里,我们迎来了DeepSeek R1、原生图像生成、o3-mini等重磅炸弹,如今2025年也不过刚过去了四个月。
在AI圈的众多消息中,连GPT-4的退出都显得不那么惊爆了。
昨天的更新日志中,OpenAI表示,现在GPT-4o已经成为了GPT-4合格的继任者。
近期的升级,提升了它的指令跟随、问题解决和对话流畅性。评估中,GPT-4o在写作、编码、STEM等方面始终优于GPT-4。
确实,现在很多人都已经不记得,自己上一次用GPT-4是什么时候了。
虽然它确实给很多人带来了美好的回忆,甚至让人一度以为AGI已经来了。
还记得2023年3月,GPT-4推出时全网欢呼的盛况吗?
当时,它在ChatGPT和微软的Copilot网页版聊天机器人中上线,引起全网惊呼。
这个模型具备多模态能力,能同时理解图像和文本,正式开启了AI「看图说话」的时代,这在OpenAI的模型中尚属首次,可谓石破天惊。
相比于GPT-3.5,GPT-4是一次更重大的认知跃迁。
它是首个在专业学术基准中达到哈佛、斯坦福毕业生水平的大模型。
它在数学、医学、法律之类的考试中击败大多数人类;在SAT、LSAT、美国律师资格考试中交出惊人答卷,能达到TOP 10%。
它的多模态架构,也为后续的模型演进提供了核心蓝本。
从此,大模型能力的阈值彻底提升至可用级,引爆了全球的AI应用生态,将生成式AI市场从百亿规模推升至万亿的量级。
它推动了Code Interpreter的诞生,为开发者提供了无限助力,间接推动了开源生态。
那时,几乎每天一个劲爆消息。那是OpenAI的高光时刻,它的一举一动都牵动着全世界的目光。
当时,全网都在猜测GPT-4的训练成本。后来奥特曼透露,GPT-4的训练成本超过了1亿美元。
终于,在23年11月,速度更快、成本更低的GPT-4 Turbo上线,接替了它的地位。
还记得这些辉煌时刻吗?
2023年3月14日,GPT-4诞生,首个多模态大模型震惊全世界,在GRE等各类考试中取得满分,凭自己就能考上斯坦福。
2023年3月16日,GPT-4全面接入微软Office全家桶,颠覆10亿打工人,人类与电脑交互方式彻底改变。
2023年3月17日,OpenAI发布35页论文官宣:GPT时代,80%的美国人就业将受AI影响。
2023年3月22日,微软154页研究刷屏,GPT-4已经可以被视为一个通用人工智能的早期版本。
2023年5月4日,GPT-4正式联网,微软开放搭载GPT-4的全新Bing聊天机器人,全面开放插件系统,无需排队人人可用。
2023年7月7日,Code Interpreter官宣向Plus用户全面开放,实测案例惊人。
就在前一天,The Verge独家爆料称,OpenAI正准备发布一系列全新模型——包括GPT-4.1(含GPT-4.1 mini和GPT-4.1 nano)、满血版o3,以及神秘的o4系列(o4-mini、o4-mini-high)。
其中,作为多模态模型GPT-4o改进版的GPT-4.1,最快将在下周面世。
目前,AI工程师Tibor Blaho已经在ChatGPT网页代码中发现了对这些模型的引用。
不过,GPT-4.5都来了,为什么下一个却是GPT-4.1?这个越来越倒退的命名规则,实在令人摸不到头脑。
它在OpenAI大模型谱系上有点前不着村后不着店,不知该放在什么位置。
有人赞叹道:看到从GPT-1到o系列以及更高级别的演变,展示了不断增加的复杂性和能力。这就像观察人工智能的进化史!
关于GPT-4.1,现在坊间已经有了蛛丝马迹。
比如有人发现,在ChatGPT的模型列表中,竟然已经出现了GPT-4.1这个选项。
这就意味着,此前泄露的小道消息是真的!这就让大家非常兴奋。
但也有人怀疑该网友是造假,把网址从GPT-4o改为了GPT-4.1。
为了自证清白,这名网友大方分享出了自己和GPT-4.1的对话链接。
因此大家确认,这名网友并没有撒谎,或伪造截图,因为顺着这个对话链接检查,会发现model-slug确实是GPT-4.1。
很快,有越来越多的人发现自己也能用GPT-4.1了。
此外,也有网友推测,奥特曼口中的「Quasars Alpha」,就是GPT-4.1。
而FT的报道也再次证实,满血版o3下周很可能再次上线。
知情人士透露,由于Meta、谷歌、xAI这些对手逼得实在太紧,OpenAI为了保持自己的技术优势并从中获利,不得不加快模型的发布速度。
为此,曾经需要数月时间进行的模型「评估」——测试模型的风险和性能,如今已被压缩到了只有短短的几天。
比如即将退役的GPT-4,就有着长达6个月的评估期。其中一些危险能力,正是在测试进行了两个月后才被发现的。
但现在给到的时间和资源,已经不足以进行全面的测试来识别和规避风险了。
此前,OpenAI曾承诺构建定制版的模型来评估潜在的滥用风险,例如是否可能助长生物病毒提高传播能力。
但这种方法成本很高,不仅要聘请外部专家,还要创建诸如病毒学这类的专业信息数据集,并将其「喂」给模型来进行微调,消耗大量的工程师和计算资源。
很明显,OpenAI不想在这件事上花太多精力——他们只对能力较弱的旧模型做了微调,没有用到更强、更先进的模型上。
比如,在1月份发布的o3-mini安全与性能报告中,仅仅提到了GPT-4o只会在微调后才能执行某项生物学任务。至于o1和o3-mini如何,OpenAI却只字未提。
另外,还有一个令人担忧的问题是,安全测试针对的并不是最终向公众发布的模型,而是更为早期的「检查点」(checkpoints)。在这之后,模型还会继续更新来提升性能和能力。
面对这些质疑,OpenAI回应称,其评估流程已通过引入自动化测试等方式提高了效率,从而缩短了所需时间。
「虽然目前还没有一套公认的方案,但OpenAI采用的方法肯定是最优的,并且已在报告中公开透明地进行了说明。」
此外,OpenAI还表示,测试所用的检查点与最终发布的版本「基本一致」。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.