马斯克带货、默写出师表?记者实测Images 2.0:懂中文、会思考,AI要抢人类饭碗

凤凰网港股
Yesterday

蓝鲸新闻4月26日讯(记者 陆鹏鹏)马斯克在抖音直播间带货老干妈、小学生在小卖部买零食、库克入职小米汽车……近日,一组图片在社交平台疯狂刷屏,这些图片画面细节逼真,几乎难辨真伪。

图片由AI生成

ChatGPT Images 2.0发布

生成图片以假乱真

近日,美国人工智能公司OpenAI正式推出ChatGPT Images 2.0模型,这是其ChatGPT平台内图像生成功能的最新一次升级。

据官方介绍,ChatGPT Images 2.0是OpenAI首个具备“思考”能力的图像模型。用户启用该功能后,系统可在生成前对图像结构进行推理规划,并联网检索信息自动补全品牌、场景等细节。此外,模型在详细指令遵循、物体的精准放置与关联以及密集文本渲染方面有了巨大进步,目前ChatGPT每周图像产出已超过10亿张。

社交媒体上热传的“马斯克带货”“小学生选零食”“库克入职小米”等以假乱真的图片,均由该模型生成。由于画面细节过于逼真,相关话题迅速冲上热搜,引发全网热议。其中,“库克入职小米”的虚假图片因传播广泛、误导性强,小米高管不得不亲自出面辟谣。

图片由AI生成

从此次升级来看,ChatGPT Images 2.0与现有其他模型的区别在于,它几乎去除了所有可识别的AI痕迹,生成的照片呈现出极强的真实感。

文字处理能力更强

会像人类一样思考

模型发布后,蓝鲸新闻记者对ChatGPT Images 2.0进行了深度实测。

图片由AI生成

首先测试的是画面精度,记者输入提示词,要求模型生成一张“马斯克带货蓝鲸新闻”的图片,不到一分钟,Images 2.0便交出了答卷。画面中,马斯克身穿黑色T恤,四周布满了蓝鲸新闻的品牌元素,其中还包括“独到视角、价值新闻”等补充性的品牌关键词。整体构图自然、细节丰富,几乎难以分辨是否为AI生成。

随后,记者尝试使用“山姆·奥特曼在直播间带货”的提示词进行生成。短时间内,Images 2.0同样给出了一幅以假乱真的图片。

图片由AI生成

画面完整复现了直播间的典型布局,左上角为“蓝鲸新闻”官方账号,显示“10万+”粉丝与点赞数量;主播位置虽为虚拟的山姆·奥特曼形象,但其神态、光影与真人直播无异。

此外,补充元素也近乎完整,“深度权威及时”的品牌标语、“7x24小时快讯不间断”的功能介绍,以及售价0.01元的“直播专享价”商品链接,甚至连网民评论的文字也能精准呈现出,整体观感与真实直播间截图几乎无法区分。

一分钟做海报、画漫画

Images 2.0来抢人类饭碗了

对于Images 2.0来说,画面精度只是最基础的升级,其最大的突破在于增加了“思考”能力。从上述两组图片的补充信息便可以看出,记者仅输入一句关键词,模型便能主动联网搜索已有信息,对画面进行补充与完善。

为了进一步验证模型的思考能力,记者进行了更深度的测试。以“蓝鲸新闻参加北京车展”为提示词,要求模型生成一张宣传海报。不到一分钟,Images 2.0便交出了一张要素丰富的图片。

图片由AI生成

画面主体为“2026北京国际汽车展览会”,地点为中国国际展览中心,并配有“现场直击、深度报道、洞察趋势”等品牌标语,整体风格正式、信息层级清晰。

不过美中不足的是,模型初次生成时将年份错写成了“2024年”。经记者再次提示纠正后,模型才将时间修正为“2026年”。这一细节也反映出,尽管模型具备一定的推理与检索能力,但在时间逻辑的自洽性上仍有提升空间。

除了海报外,记者还让模型生成了一组以蓝鲸新闻为主题的漫画,这一次,Images 2.0展现了它在多模态叙事上更强的思考能力。

图片由AI生成

整个漫画共6格,画风统一,剧情连贯。整组漫画不仅角色形象(蓝鲸标志、记者造型)前后一致,对话框中的中文文字也渲染得清晰准确,幽默感和叙事逻辑均在线。可以看到的是,Images 2.0已经从单张“造图”进化到了能够理解并执行完整短剧分镜的水平。

可以说,Images 2.0已经在直接挑战设计师与漫画家的“饭碗”,那些过去高度依赖人工完成的创意排版、海报绘制和多格漫画工作,正面临被AI快速替代的风险。

总结来看,ChatGPT Images 2.0在多个维度实现了跨越式升级:像素级精度上,小字号文本、图标、UI元素等复杂细节可一键生成;多语言渲染迎来质变,中文等文字得以精准呈现,通篇默写《出师表》也不在话下;视觉风格日趋成熟,从照片级逼真感到电影剧照、动漫漫画,都能拿捏得当;更为关键的是,它成为首个具备推理能力的图像模型,能够主动联网搜索、自我复核输出。

图片由AI生成

不过该模型也并非十全十美,记者实测发现,Images 2.0生成的所有直出图中均没有标注“AI生成”的强制水印。这直接导致了当前网络生态中,大量以假乱真的图片被造谣者拿来制作虚假新闻。随着Images 2.0生成的图片越来越真实,人类分辨真假的难度也在同步上升。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10