藍鯨新聞4月26日訊(記者 陸鵬鵬)馬斯克在抖音直播間帶貨老乾媽、小學生在小賣部買零食、庫克入職小米汽車……近日,一組圖片在社交平台瘋狂刷屏,這些圖片畫面細節逼真,幾乎難辨真僞。
圖片由AI生成
ChatGPT Images 2.0發布
生成圖片以假亂真
近日,美國人工智能公司OpenAI正式推出ChatGPT Images 2.0模型,這是其ChatGPT平台內圖像生成功能的最新一次升級。
據官方介紹,ChatGPT Images 2.0是OpenAI首個具備「思考」能力的圖像模型。用戶啓用該功能後,系統可在生成前對圖像結構進行推理規劃,並聯網檢索信息自動補全品牌、場景等細節。此外,模型在詳細指令遵循、物體的精準放置與關聯以及密集文本渲染方面有了巨大進步,目前ChatGPT每周圖像產出已超過10億張。
社交媒體上熱傳的「馬斯克帶貨」「小學生選零食」「庫克入職小米」等以假亂真的圖片,均由該模型生成。由於畫面細節過於逼真,相關話題迅速衝上熱搜,引發全網熱議。其中,「庫克入職小米」的虛假圖片因傳播廣泛、誤導性強,小米高管不得不親自出面闢謠。
圖片由AI生成
從此次升級來看,ChatGPT Images 2.0與現有其他模型的區別在於,它幾乎去除了所有可識別的AI痕跡,生成的照片呈現出極強的真實感。
文字處理能力更強
會像人類一樣思考
模型發布後,藍鯨新聞記者對ChatGPT Images 2.0進行了深度實測。
圖片由AI生成
首先測試的是畫面精度,記者輸入提示詞,要求模型生成一張「馬斯克帶貨藍鯨新聞」的圖片,不到一分鐘,Images 2.0便交出了答卷。畫面中,馬斯克身穿黑色T恤,四周佈滿了藍鯨新聞的品牌元素,其中還包括「獨到視角、價值新聞」等補充性的品牌關鍵詞。整體構圖自然、細節豐富,幾乎難以分辨是否為AI生成。
隨後,記者嘗試使用「山姆·奧特曼在直播間帶貨」的提示詞進行生成。短時間內,Images 2.0同樣給出了一幅以假亂真的圖片。
圖片由AI生成
畫面完整復現了直播間的典型佈局,左上角為「藍鯨新聞」官方賬號,顯示「10萬+」粉絲與讚好數量;主播位置雖為虛擬的山姆·奧特曼形象,但其神態、光影與真人直播無異。
此外,補充元素也近乎完整,「深度權威及時」的品牌標語、「7x24小時快訊不間斷」的功能介紹,以及售價0.01元的「直播專享價」商品鏈接,甚至連網民評論的文字也能精準呈現出,整體觀感與真實直播間截圖幾乎無法區分。
一分鐘做海報、畫漫畫
Images 2.0來搶人類飯碗了
對於Images 2.0來說,畫面精度只是最基礎的升級,其最大的突破在於增加了「思考」能力。從上述兩組圖片的補充信息便可以看出,記者僅輸入一句關鍵詞,模型便能主動聯網搜索已有信息,對畫面進行補充與完善。
為了進一步驗證模型的思考能力,記者進行了更深度的測試。以「藍鯨新聞參加北京車展」為提示詞,要求模型生成一張宣傳海報。不到一分鐘,Images 2.0便交出了一張要素豐富的圖片。
圖片由AI生成
畫面主體為「2026北京國際汽車展覽會」,地點為中國國際展覽中心,並配有「現場直擊、深度報道、洞察趨勢」等品牌標語,整體風格正式、信息層級清晰。
不過美中不足的是,模型初次生成時將年份錯寫成了「2024年」。經記者再次提示糾正後,模型纔將時間修正為「2026年」。這一細節也反映出,儘管模型具備一定的推理與檢索能力,但在時間邏輯的自洽性上仍有提升空間。
除了海報外,記者還讓模型生成了一組以藍鯨新聞為主題的漫畫,這一次,Images 2.0展現了它在多模態敘事上更強的思考能力。
圖片由AI生成
整個漫畫共6格,畫風統一,劇情連貫。整組漫畫不僅角色形象(藍鯨標誌、記者造型)前後一致,對話框中的中文文字也渲染得清晰準確,幽默感和敘事邏輯均在線。可以看到的是,Images 2.0已經從單張「造圖」進化到了能夠理解並執行完整短劇分鏡的水平。
可以說,Images 2.0已經在直接挑戰設計師與漫畫家的「飯碗」,那些過去高度依賴人工完成的創意排版、海報繪製和多格漫畫工作,正面臨被AI快速替代的風險。
總結來看,ChatGPT Images 2.0在多個維度實現了跨越式升級:像素級精度上,小字號文本、圖標、UI元素等複雜細節可一鍵生成;多語言渲染迎來質變,中文等文字得以精準呈現,通篇默寫《出師表》也不在話下;視覺風格日趨成熟,從照片級逼真感到電影劇照、動漫漫畫,都能拿捏得當;更為關鍵的是,它成為首個具備推理能力的圖像模型,能夠主動聯網搜索、自我複覈輸出。
圖片由AI生成
不過該模型也並非十全十美,記者實測發現,Images 2.0生成的所有直出圖中均沒有標註「AI生成」的強制水印。這直接導致了當前網絡生態中,大量以假亂真的圖片被造謠者拿來製作虛假新聞。隨着Images 2.0生成的圖片越來越真實,人類分辨真假的難度也在同步上升。