這一次,OpenAI幹掉了90%人類設計師

藍鯨財經
04/27

文|硅基星芒

Sam Altman那個著名的梗,這次應驗在所有人身上了。

去年宣傳GPT-5的時候,這位OpenAI的CEO說了一句後來被全網玩壞的話:「那種感覺,就像看到原子彈爆炸,整個人眩暈癱坐。」此後每逢AI圈發布新品、配上誇張文案,這個梗就被拉出來反覆鞭屍。

但前天深夜,眩暈癱坐的可不是奧特曼。這回成了所有盯着螢幕等OpenAI出牌的用戶。

奧特曼照例故作神祕,發了一條推文:「我們準備了一些有趣的東西。」

到了凌晨三點,GPT-Image 2落地。全球AI界直接炸場。

「Images are a language, not decoration.」

這是OpenAI寫在發布頁上的第一句話。翻譯過來就一個意思:從今天起,圖像不再是裝飾品,它本身就是語言。這是對整個計算機視覺行業發出的代際躍遷宣言。

過去一整年,AI繪圖還困在「畫得像不像」的審美泥潭裏。GPT-Image 2一出現,直接按下了切換鍵——AI生圖正式進入「邏輯對不對」的智力考場。

這款模型的精度,用「恐怖」來形容不過分。

在Artificial Analysis的文生圖和圖像編輯排行榜上雙雙登頂,實戰表現更是碾壓級的。

那種感覺,就像視頻生成領域Seedance 2.0降臨時一樣,它早就不當人類的輔助工具了,它在定義新的行業標準。

注:本文的圖片全部由GPT-Image 2生成,圖片內容純屬虛構。

01思維引擎的覺醒

過去,人們評判一個圖像模型好不好,第一標準是像不像真人、像不像參照物。

在GPT-Image 2這個怪物面前,這套標準過時了。徹底過時。

新模型最核心的突破點在這兒:它是一個支持思考模式的圖像模型。

什麼意思?用戶輸入提示詞之後,模型不再簡單去噪、拼接像素。它先在後台完成一次思維建模,再動筆。

Linux.do社區流出的一張實測圖最能說明問題。模型模擬了雷軍直播跑步的畫面:

圖源:https://cdn3.linux.do/original/4X/0/f/3/0f37c8bc968e3d563cc6100d8e7f80ee305661ff.jpeg

這張圖讓不少開發者倒吸一口涼氣。雷總面部特徵精準還原——簡直像照片——圖中還赫然顯示着:直播目標1313km、已跑里程425.7km、剩餘里程887.3km。更絕的是,當前海拔標着3658m。

3658m是什麼概念?從北京到拉薩,進入藏區的典型海拔,恰好就是這個數。

在人類眼裏,這不過是簡單的數學加減法和地理常識。但請你想一想:對於一個圖像模型來說,數學邏輯 + 地理常識 + UI規範的三重統一,意味着什麼?

結論很直接:在生成第一個像素之前,GPT-Image 2已經完成了一輪推理。它理解了「里程」的含義,理解了加減法的邏輯關係,也理解了高海拔地區的視覺特徵。

這哪裏是畫畫。這是思考。

 從玩具到生產力

在這種能力面前,所有人對圖像模型的態度,該變一變了。

它早就不是你拿來畫頭像、做壁紙的玩具了。一腳邁過「可用」門檻,直接衝進「好用」區間——一個能扔進商業場景直接幹活的工具。

拿海報設計來說。GPT-Image 2的構圖審美、光影處理、對品牌調性的拿捏,毫無疑問達到了絕大多數普通人類設計師難以企及的高度。

圖源:https://cdn3.linux.do/original/4X/7/a/1/7a12ccd6b745be5ad8828eb0ac225d218fb43cbc.jpeg

在人類社會中,聘請一位高級美工設計一張商業級海報,溝通成本、時間成本和上千元的設計報酬往往對中小企業來說是沉重的負擔。

然而,有了GPT-Image 2,即使效果不滿意調整幾十次,成本也不過是幾美元的級別。

在海報設計、營銷素材、插畫配圖這些領域,用戶在乎的根本不是「真不真」,在乎的是「好不好看、準不準」。正因如此,AI的替代效率是毀滅性的。

在同步更新的開發者文檔中,還隱藏着一個令人興奮的細節:示例代碼中頻繁出現了model:「gpt-5.4」。

思考模式加上旗艦模型,這個組合暗示了一件事:GPT-Image 2絕非孤立產品。它是為下一代大語言模型而生的視覺終端。

通過新的Responses API,生圖過程會像和大語言模型聊天一般自然地交互。模型新增了允許多輪對話修改的功能,首次生圖結束後,用戶可以提出各種讓乙方頭疼的指令進行修改。

通過新的Responses API,生圖過程會像和大語言模型聊天一樣自然交互。模型新增了多輪對話修改功能,第一版生成後,用戶可以提出各種讓乙方設計師血壓飆升的指令:「背景再暗一點。」「Logo往旁邊挪幾個像素。」

這些交互式實時修改需求,恰恰是設計師日常工作中最繁瑣、最消耗耐心的部分。現在,迎刃而解。

 中文渲染的巔峯

GPT-Image 2雖然是國外的模型,國內用戶卻一邊倒地叫好。

原因只有一個:它對漢字的支持,堪稱完美。

在社區的實測返圖中,你能看到羅永浩和王自如的名場面辯論:

圖源:https://cdn3.linux.do/original/4X/0/9/7/097ed46991d2464442aebc6b1076a292cc839fec.jpeg

能看到馬斯克直播帶貨老乾媽:

圖源:https://cdn3.linux.do/original/4X/2/f/a/2fa77cf040e6337643829df4ec5ca6467d2866b2.jpeg

甚至能看到醫生寫的藥方:

圖源:https://cdn3.linux.do/original/4X/9/f/f/9ffeab83675648b43116cd0763f6c8b560611ae6.jpeg

這些圖片中的文字,早已不再是歪七扭八、胡亂拼湊的「僞漢字」,而是具備書法韻味、字體層次感和排版藝術的成熟設計稿。

顯然,OpenAI在訓練集裏灌入了海量中文語料圖像,做了針對性強訓。

和前代模型比起來,GPT-Image 2的強大得以更加淋漓盡致地體現。

在對比測試中,前代模型1.5版本雖然能畫出像菜譜的東西,但仔細一看,文字幾乎全是亂碼。

圖源:https://cdn3.linux.do/optimized/4X/2/b/3/2b38f3c1a134515d564f07f81661c0bd9578c6b9_2_750x750.jpeg

但GPT-Image 2生成的相同菜譜,卻讓人看到了文字清晰度和審美已經有了里程碑式的突破。

圖源:https://cdn3.linux.do/original/4X/0/2/5/02513b10135d824ccb1c22bd0c7eb441f1e34455.jpeg

對於上百個中文字符的提示詞,五個步驟仍然清晰可見,圖文一致性令人滿意。這不僅是一張圖,還是一套可復現的實操方案。

不過,這裏也帶出一個有趣的技術問題:圖像模型真的徹底解決了亂碼問題嗎?

我的判斷是:恐怕沒有。

大語言模型生成token,靠的是語義邏輯。強化學習階段以概率為依據,高質量語料越多,邏輯越合理。但圖像模型的本質,終究是像素生成。像素之間的邏輯關係,跟文字之間的邏輯關係,根本不是一回事。

換句話說,強大如GPT-Image 2,也並沒有真正「理解」文字的規律。它只是死記硬背了文字在像素層面上的長相。

一張與奧特曼談生意的圖暴露了這一點:兩箱飲料包裝上大大的「蒙牛」和「王老吉」寫得極其完美,底下的小字卻依然是模糊的色塊。

圖源:https://cdn3.linux.do/original/4X/d/7/c/d7c4fb063202bcbf56b9ca0623aa0ce6fc26e542.jpeg

在現有技術範式下,生成邏輯還是「按像素排布」,離「按字符渲染」差着本質的一步。極細微處的亂碼,可能永遠無法徹底根除。

但話說回來,對90%以上的商業應用場景而言,這已經足夠了。

 尚未封神的缺陷與邊界

即便已經坐上世界第一的寶座,GPT-Image 2也有它笨拙的一面。

實測中發現,由於思考模式會調用聯網搜索並進行邏輯推演,在處理極其複雜的虛構任務時,模型偶爾會陷入邏輯怪圈——思考了接近40分鐘,仍然無法作答。

與此同時,API宣稱的支持2K甚至4K分辨率,意味着極高的token消耗和延遲。

對於普通用戶來說,如何在極致畫質和響應速度之間取得平衡,是未來使用中的必修課。

在技術領域,強大的能力永遠是一把雙刃劍。

無論是圖像模型還是視頻模型,都不可避免地要面對深度僞造的倫理挑戰。

目前的大部分實測案例中,AI生成的都是知名人物,但若是將他們換成各種社交媒體上發布過照片的普通人,在不認識本人的情況下已經極難分辨出真假。

除了背景中偶爾出現的亂碼可能會讓AI露餡,人體本身已經沒有任何破綻。

因此,那些曾經必須由真人完成的領域,正在面臨着前所未有的信任危機。

GPT-Image 2的發布,讓生圖模型從玩具走向了生產力工具。

過去人們用AI提供靈感,而如今的AI開始嘗試接管從構思、計算、排版到成品的全流程。

對於設計從業者來說,這是一個充滿FOMO的時代。

但對於那些善於利用工具、具備產品審美和邏輯思維的人來說,這又是一個最好的時代。

圖像開始學會思考,文字不再是像素的雜音。

人們距離那個所思即所得的視覺奇點,可能真的只有一步之遙了。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10