圖片AI迎來GPT時刻,大模型吞噬垂類的詛咒還在嗎?
原創科技新知前沿科技組
作者丨櫻木編輯丨江蘺
最近,一根香蕉打破了AI圈的平靜。
最初可能只是朋友圈病毒式傳播的手辦圖,但隨後事情似乎向着瘋狂的方向發展,上線不到兩週,谷歌旗下的Nano Banana已在全球生產超2億張圖片,亞太地區用戶熱情度居首。而英偉達CEO黃仁勳成了它的忠實用戶,在倫敦,他面對一衆記者,公開宣稱自己是Nano Banana的忠實粉絲。
瘋狂的流行帶來了另一個好處,就是直接帶動了Gemini App的用戶增長。在短時間內,Nano Banana為Gemini App帶來了超過1000萬新用戶。而在前不久,Nano Banana更是幫助谷歌Gemini超越了霸榜蘋果應用榜很久的ChatGPT。
相關的連鎖反應也在進一步加深,在海外,有報道顯示,為了應對nano Banana帶來的衝擊,openAI以約11億美元的全股票交易方式,收購產品實驗平臺Statsig。伴隨此次收購,Statsig的創始人兼首席執行官Vijaye Raji將加入OpenAI,擔任新設立的「應用部門首席技術官」。
在國內,字節快速跟進推出了seedream4.0,試圖通過這一方式強化豆包和即夢的用戶心智。而另一邊,垂類應用美圖,則遭遇了危機,通用模型吞噬垂類應用的故事,影響着資本市場對其未來的判斷,股價經歷了巨量波動。
雖然外資投行,依然為美圖站臺,但通用模型的勢能仍好像「達摩克利斯之劍」影響着公司。
一時間,AI世界的變化,開始圍繞着這一超級應用泛起波瀾。其實類似的波動,讓人總會想起,GPT-4o帶來的吉卜力畫風的時刻,而與之相對應的則是,通用模型是否會代替掉垂類AI應用的探討。
前OpenAI研究員姚順雨曾在播客中表達,創業公司對比大模型公司最大的機會在於能不能設計出不同的interface(交互方式),可能模型的能力會產生beyond chatgpt的交互方式,變成superAPP。
但從另一個維度來看,主流研究員則認為,長期耕耘C端業務的垂類應用,有着對用戶精細化的理解,而在B端,特定場景的know-how也能為垂類應用公司壘起一定的護城河。無疑nano Banana像是一場突如起來的變革,攪動着AI圈的神經,而到到底是促增長的功能,還是搶地盤的入侵,似乎值得一番拆解。
01
谷歌「香蕉」攪動AI圈
如果順着姚順雨的思路來看,Nano Banana確實正在顛覆圖片創作的邏輯。
在以往,大模型如果要生成圖片,prompt提示詞非常關鍵,用戶需要學習結構化的提示詞才能獲取較好的效果。甚至在一些場景中,需要專業的提示詞才能達到應有的效果。
後續的修改,無論是通過Midjourney的「Vary」功能還是DALL-E的局部重繪,都感覺像是獨立的、離散的操作。
而現在,Nano Banana的快速響應和自然度,讓創作更像實時對話,而不是反覆抽卡。這也是許多人第一次感到,AI圖像生成變得像實時創作。用戶不再需要反覆調試結構化的咒語,而是通過簡單的自然語言對話,就能對圖像進行精確修改。
Nano Banana繼承了Gemini大模型的「原生世界知識」,這意味着它不僅僅是一個圖像生成器,更是一個具備常識和推理能力的系統。它能夠理解和生成具有深層語義準確性的圖像.在羅永浩與周鴻禕最新的對談中,也提到了,語言對於AI幫助的核心價值。
根據報道,這一切讓Nano Banana在風格一致性、多圖融合、精準的逐步編輯以及設計與風格遷移等多個方面上,有了出色的表現。
Nano Banana通過更精確的理解和更細緻的任務拆分,實現了高度一致性的圖像編輯。某種程度上,這是通過模型定義實現的一種更近似Agent的能力。
從這個角度來看,其顛覆感正如姚順雨所說,正在改變交互的方式,這也是它為何能夠震動AI圈的原因。在此基礎上,Nano Banana也做到了成本低、速度快。在Google的介紹中,Nano Banana的定價為30美元/百萬token,每張圖片生成所需的token在1290個左右,成本約合0.039美元。
而從另一個視角來說,Nano Banana的實現路徑,似乎很難複製,在團隊的訪談和公開分享裏,Nano Banana的幾個方向被反覆提及:文字渲染、交錯生成、速度哲學,以及世界知識的引入。這些關鍵詞組成的其實是,背後強大的模型能力所帶來的降維打擊。
那麼,另一個問題就非常值得關注了,面對如此強大的工具,以及國內已經逐漸明朗的大模型廠商格局,是否意味着,如果按照Nano Banana的思路,就可以成功顛覆垂類的AI應用呢?
02
美圖們的護城河在哪兒?
在美圖暴跌之後,相關券商的調研也相繼出爐。9月2日,摩根士丹利研報指出,美圖的增長軌跡並未受到AI模型Nano Banana的影響,其真正的價值在於提供了基礎AI模型無法企及的「最後一公里」解決方案。
報告強調美圖憑藉其在垂直領域的深厚積累、專有數據以及對核心付費功能的專注,構築了堅實的護城河。此外,公司對所有AI模型保持開放和中立,並已將Nano Banana等新技術無縫整合進產品中。
而與此同時,也有業內人士表達,美圖的C端業務主要優勢在於對美顏美體的精細化理解,目前看nano的手辦模型只是一種新的玩法,並不威脅C端主業。而美圖的B端業務主要是圍繞商拍等核心功能服務大C小B的客戶,優勢在於對於特定場景的know-how、在商拍環節,nano主要聚焦商品多角度複製性以適應不同社交平臺模板,而美圖產品則聚焦商品高匹配背景及模特,這個賽道國內海外目前確實湧現出了許多創業公司,但是大家在一塊全新的市場,目前的玩法、打法都不甚相同,還沒有到存量競爭的狀態。
儘管如此,從敘事來看,美圖做為垂類應用,AI仍是其轉型的關鍵。從2022年開始,美圖率先在旗下產品Wink中上線視頻畫質修復技術,並逐步延伸出畫質優化、視頻分辨率提升、人像增強等一系列細分功能,形成完整的畫質修復能力矩陣。進入2023年,美圖進一步豐富了AI功能版圖,同時正式切入B端市場,為美業領域量身打造AI測膚解決方案,開啓ToB業務的探索。
隨後2024年,與阿里巴巴達成2.5億美元(約合人民幣18億元)戰略投資,雙方明確將在電商平臺、AI技術、雲計算三大核心領域展開深度合作。其中在電商合作層面,雙方重點推進兩大方向:一是計劃聯合推出「AI試衣」功能——依託美圖成熟的AI試衣技術,結合阿里巴巴平臺豐富的商家服裝資源,從根本上優化線上購物的體驗痛點;二是美圖設計室將向淘天商家後臺開放部分核心能力,例如「AI商品圖」生成功能,幫助商家高效提升商品視覺呈現效果。
從以上可以看出,美圖的位置非常微妙,在c端,它通過AI技術進行自我迭代與升級,在b端,則通過自身技術賦能電商用戶,而無論哪一個業務,似乎都還是技術沉澱過後的串聯與精細化。
從某種程度來說,美圖更多的優勢在於用戶心智、用戶經驗以及精細化,而這些是否能夠讓其保持現有的業務模型不受干擾,似乎需要時間驗證。
而另一方面,按照之前的邏輯,美圖圍繞着美圖秀秀等垂類賽道的superapp進行着業務進行,從某種程度來說,似乎需要更大層面的交互方式的變化,才能佔住更強的心智。同時,如國內頭部模型廠商開始進入到這一賽道之後,對其是否有更強的顛覆,值得一番思考。
美圖是AI變革下的一個典型代表,每一次當巨頭模型公司發生技術溢出時,垂類AI應用就將經歷考驗,而這種不確定性,則會成為公司需要長期面對的命題。
03
場景賦能是終極勝負手
從硅谷的經驗來看,其實大模型公司與垂類AI公司的競爭,從來都是一個經久不衰的話題,比如,anthopic旗下的cloude code與編程垂類應用cursor,其追趕的速度都是超乎尋常。而面對這方面的競爭,似乎垂類AI的辦法,並沒有想象的多。
投資人朱嘯虎曾在採訪中坦言:AI Coding我一開始就不敢投,我覺得這肯定是大廠的天下。今年特別有意思,中國在補貼外賣,美國在補貼AI Coding,幾乎都是負毛利。你收幾十美金一個月的訂閱費,消耗的Token可能都是幾百美金,這都是拿投資人的錢在補貼程序員。而程序員這個羣體是最沒有忠誠度的,哪個API好用、哪個便宜,他們就用哪個。
迴歸到這次事件的主角,美圖在此前的計劃重心是在出海。在大摩的報告中,公司設定的首個里程碑是,在三年內(2025-2028年)將整體付費率提升至8-10%——這是在2024年4.7%基礎上的巨大飛躍;長期來看,其目標更指向休閒類產品付費率10%以上、生產力工具付費率20%以上的更高天花板。
但要實現這一系列聚焦「用戶付費轉化」的目標,美圖首先要應對的,正是Nano Banana所代表的通用大模型衝擊:當「對話式創作」重構了用戶對圖像AI的交互期待,垂類應用若仍困守傳統功能,此前的付費率規劃便可能淪為空談。
而美圖的應對邏輯——將Nano Banana技術整合進自身產品,同時聯合阿里深耕「AI試衣」這類場景化服務,恰恰為國產垂類AI指明瞭破局方向:這場看似「巨頭碾壓垂類」的博弈,實則已被撕開轉機的裂縫。
危機從不是大模型的技術溢出,而是垂類對自身價值的誤判——誤將「工具能力」等同於「用戶價值」;轉機也從不是與大模型比拼參數算力,而是成為大模型落地現實場景的「場景翻譯官」與「價值放大器」。畢竟大模型提供的只是「通用能力底座」,而垂類沉澱的用戶心智(如美圖之於「美」的認知)、場景know-how(如商拍中的背景匹配邏輯)、B端服務閉環(如對接電商的商家需求),纔是把技術轉化為「用戶願付費的服務」的關鍵,也是決定AI能否真正解決痛點的「最後一塊拼圖」。
對國產垂類AI而言,真正的突破點從不是「造一個更好的香蕉」,而是跳出「與大模型對抗」的思維定式,像美圖錨定付費率目標那樣,聚焦「用大模型賦能場景」:當通用技術與垂類場景深度綁定,所謂的「危機」便會轉化為「差異化競爭」的轉機——畢竟AI的終極戰場從不是技術排行榜,而是能否擊中用戶願意買單的真實需求。
也許,正如朱嘯虎所說,AI時代的演化速度可能是移動互聯網的三倍速,甚至更快,所以很多機會也會更快被證僞。當年移動互聯網的很多工具App還能有不錯的退出,但在三倍速的AI時代,退出可能會難很多。所以創業者要用十年、二十年的眼光來看,什麼東西是更可持續的,要去離大廠不只是一條馬路,而是兩條馬路、三條馬路之外尋找機會。
資料來源:
鋅刻度,《押注AI,美圖就能奪回失去的一切?》
硅星人pro,《Nano Banana有點ChatGPT時刻的味兒了》
智百道,《深度體驗谷歌Nano Banana後,我們發現了它的AB面》
硬AI,《AI吞噬軟件又一案例?谷歌Nano Banana走紅,美圖股價重挫》
美股IPO,《大摩:美圖的「增長戰略」,AI提升付費率,海外拉動用戶增長》
硅星人pro,《對話朱嘯虎:搬離中國,假裝不是中國AI創業公司,是沒有用的》
- The end -