對話快手可靈丨AI 新世界加載中,我們還能做些什麼?

市場資訊
昨天

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

無情的迭代機器

作者丨高珮莙

遠古獵人王涵因爲一次雷電患上了“馬丁症”,每隔24小時,他的意識就會穿越到不同人的身體裏。爲了找回和保護女兒,他在兩千年的時間裏不斷穿越,當過將軍、富翁、宇航員,卻始終無法停留。

一隻被基因改造的流浪狗“李”,在霓虹閃爍的都市孤獨地生存,始終無法走出過去被背叛的噩夢。直到遇到一位同樣是實驗體的小女孩,收穫了愛與溫情,併爲了她勇敢地對抗邪惡組織。

這些充滿科幻和奇幻色彩的故事,來自6月25日在北京舉行首映禮的AI單元故事集《新世界加載中》,由7個各自獨立的劇集故事組成,時長共180分鐘。

新世界加載中》首映禮現場

雪豹財經社在首映禮當天觀看了其中三部劇集。以看慣了大銀幕和爆款劇的挑剔眼光來看,它當然並非無可挑剔:一些非關鍵人物的動作稍顯僵硬,對口型的準確性有待提升,部分情節的邏輯略顯跳躍,以及片長限制導致的背景和情感鋪墊不夠完整。

但如果考慮到這部短片集的核心“創作者”——可靈AI,是一個正式發佈才一年的“孩子”,它在某些方面的表現的確可圈可點,甚至堪稱驚豔。

比如,水流的波動和動物毛髮的紋理質感真實自然,長鏡頭下的人物表情變化細膩,在一段二維動漫風格的連續打鬥戲中,動作銜接連續流暢。

《新世界加載中》海報

這也是可靈AI產品及運營負責人李楊和《新世界加載中》總導演、異類Outliers創始人陳翔宇的一致判斷:AI生成視頻距離高水準的大銀幕製作還有距離,但用AI工具創作的不同題材的作品,已經開始滲透到人們的日常生活中。

從2024年年底開始,一系列由AI“魔改”的寵物視頻在各大社交平臺上爆火,狗狗跳舞、貓貓做飯成爲被津津樂道的談資。一些短劇導演開始用AI製作打鬥、戰爭、大空鏡等畫面,極大地節約了成本和時間。陳翔宇透露,AI製作動畫的工時約爲傳統制作方式的1/3,成本則不到1/2。

未來它將在廣告、遊戲、影視等更大的行業扮演什麼樣的角色?目前還沒有明確的答案,但一些共識已經形成:AI也許會帶來顛覆性的改變,那將是一個有巨大潛力的市場。

《新世界加載中》的片名,顯然就是這樣一個有意而爲之的巧妙雙關。“《新世界加載中》是我們和可靈發出的第一聲信號。”陳翔宇說。

2024年6月6日,快手的視頻生成大模型可靈AI正式上線,只比OpenAI的Sora晚了不到4個月。據快手CEO程一笑介紹,該項目從當年年初就開始內部孵化。

過去一年來,可靈AI快速迭代了22次,與此同時,國內外巨頭們也在加速入場,如今已呈現百花齊放的行業格局。Meta在去年10月首次推出Movie Gen,阿里的通義萬相在今年1月升級推出萬相2.1視頻生成模型,字節跳動的即夢AI在3月完成著作權登記。5月,谷歌Veo 3在 Google I/O 開發者大會上正式發佈,憑藉音畫一體化生成的功能引發外界關注。

在 Artificial Analysis 視頻生成榜單中,可靈系列與谷歌Veo系列分別佔據文生視頻、圖生視頻的全球前二;東方證券將二者技術實力歸類爲T0梯隊,特別是在穩定性、運動表現等維度的表現。

截至目前,可靈AI全球用戶規模突破2200萬,擁有超1萬名開發者和企業用戶。今年一季度,可靈AI營收超過1.5億元,其中來自P端(Prosumer,產消者,兼具生產與消費雙重角色的主體)訂閱用戶的貢獻近70%。

只不過,在新世界到來之前,技術的迭代提升、創作者生態的搭建、商業化路徑的探索,都還是需要持續攻克的難關。

首映禮當日,可靈AI產品及運營負責人李楊和《新世界加載中》總導演陳翔宇在一場媒體羣訪中分享了他們的感受和思考,雪豹財經社受邀參加了交流環節,以下是對話節選(內容經摘編):

左一爲陳翔宇、左二爲李楊

Q:今年可靈在技術上有哪些突破?

李楊:從去年到現在,可靈AI一直紮實地做基礎模型,圍繞幾個重要的點有很大提升:一是語義遵從,讓模型更聽話;二是運動表現,包括運動的速度、質量、美感、自然度、是否符合物理規律。2.1模型的運動表現非常好,創作者挑戰了很多高速運動和極致的互動表現,效果還不錯。

依託可靈2.1模型生成的視頻

Q:可靈AI全球用戶量突破2200萬,專業創作者佔比如何?

李楊:有一定專業創作能力的用戶佔比還是非常高的。今天的AI創作不是一鍵生成,沒有那麼簡單,如何寫Prompt、如何調和生成自己腦海中的效果,都非常考驗專業性和韌性。

Q:可靈AI是如何考慮下一階段產品形態的?

李楊:行業裏有很多Agent或工作流,總體還不太成熟,用戶更多地看到炫酷的過程,而不是真正完整的可用結果。可靈做產品的核心出發點還是看交付結果。

基於這樣的導向,接下來會有更多產品形態,也會基於已有的模型和功能做更多探索。我們不會貿然去follow一些聽起來很時髦的、概念性的產品,還是紮實解決用戶真實的問題。

Q:未來商業化有多大的想象空間,今年有什麼目標?

李楊:我們已經看到AI在短劇製作行業的一些可能性,它本身又是近幾年增速最快的內容類型,如果不斷提升工具的專業能力和行業滲透率,還是有比較大空間的。最近經常有一些短劇導演跟我說,之前他們拍宮廷劇得去橫店蹭鏡頭,最近都用可靈AI生成大空鏡以及打鬥和戰爭場面,這是一個很有力的幫助。

目前可靈AI服務相對專業的P端人羣,未來想要有更大規模,一定會做破圈這件事。這要求有更好的基模、更簡單的產品形態和更明確的價值導向、場景導向,讓普通用戶也能用起來。可靈AI平臺上已經有一些特效模板,比如衝浪,C端用戶可以用它做一些新奇、有趣的內容創作。

我們確實有一些商業化目標,但目前這些數字更多地還是印證市場和用戶需求的可能性,單純說數字沒什麼意義,因爲行業還在早期階段。

Q:有一種說法是,現階段各個模型在功能上都沒有什麼短板,拼的是長板,可靈的長板是什麼?

李楊:我不覺得今天模型沒有短板,短板挺多的,各種各樣,還沒有到達“短板不重要、長板足夠長”的狀態。視頻畫面和表達是多元素構成的,包括語義遵從、運動表現等,要做一個六邊形戰士,各個方面都要好。

可靈AI起步很早並快速迭代,創作者普遍認爲它綜合表現很好。可靈AI非常擅長寫實風格的表達,也看到一些評價說可靈運動上限最高,因爲做動態視頻,運動非常核心,可靈在這一塊有優勢。

Q:對未來有什麼樣的預期?

李楊:坦率地說,不管是可靈還是其他視頻模型,大家起跑速度和起點不一樣,但都在同一個大範圍內。未來還有非常多要做,包括模型的基礎表達、穩定性、可控性,達到某一個點之後纔會長出更多產品形態,這是前提。

我希望未來AI創作這件事情儘可能再簡單一點。我經常開玩笑說,我們這個產品有時挺反人性的,創作者在電腦上打開無數個頁面,跑無數張圖,不斷地抽卡,其實挺痛苦的。希望基礎模型能力更紮實,多模態能力更好地融入到產品當中,用戶可以用一種更簡單的方式表達自己的想法。

Q:谷歌Veo 3發佈之後,音頻生成同步能力、場景理解及結合YouTube的視頻數據比較佔優勢,可靈會從哪些方面進行追趕?

李楊:谷歌Veo 3是非常不錯的模型,可以實現文本生成視頻帶音效,展現了非常強的技術能力。但另一方面,它也帶來了一個問題:不可控或不可保持一致性的東西又多了一個,叫音色。可靈AI依然堅持初心,希望首先把基礎模型做好。視頻模型雖然發展很快,但還是有很大優化空間,包括運動模糊、邊緣模糊、羣像人臉崩壞、穩定性等問題,也包括AI音效的能力,這些基礎能力我們在不斷優化。

好的數據一定對模型有價值,Veo 3用YouTube的數據,就像找到了“數據石油”。但模型迭代除了算力、數據、算法以外,更重要的還是要儘早跟用戶有交互,瞭解用戶有什麼需求,儘早迭代和上線用戶需要的功能。

Q:字節說即夢收費是全行業最低,你們會調價嗎?

李楊:從行業趨勢看,每過一段時間,推理成本會大幅下降。從市場來看,未來不管是可靈AI還是其他模型,用戶的使用成本都會逐步降低,這是大趨勢,而且可靈會做得更激進一點。

可靈最新發布的2.1標準版和專業版Pro,性價比非常高,5秒視頻3.5元,合0.7元每秒,而友商普遍在1元每秒甚至更高。我們還是希望把好的技術、產品帶給用戶。

Q:各模型廠商都爲P端用戶提供技術、資金、宣發等支持,可靈的優勢在哪裏?

李楊:可靈AI從發佈第一天起,就非常關注創作者的反饋和交互。除了資金、技術、宣發支持以外,我們還在去年7月第一個上線了未來合夥人計劃的模型平臺,希望幫助創作者找到更多商業化的機會,也能夠幫IP和品牌廣告主匹配更合適、更有創作能力的創作者。因爲只有創作者活得好,我們才能夠共同建立一個更好的生態。

可靈AI運營團隊跟超級創作者也保持了非常緊密的配合,在圈子裏認可度比較高,產品和模型迭代離不開創作者的反饋。

Q:可靈AI在行業中處於什麼樣的位置?

李楊:大模型是一個“高危”行業,非常卷,恨不得一覺睡起來就又有大模型顛覆你。但可靈AI從去年到現在一直保持Tire 1水平,一直在第一梯隊。雖然現在其他家模型在陸續發佈和迭代,都很不錯,但我們綜合實力非常強,而且是無情的迭代機器,還會不斷優化。

Q:今年的模型迭代走向了一個平穩和你追我趕的階段,這種狀態會持續多久,轉折點會在哪裏?

李楊:這是一個正向的信號,因爲行業在技術上沒有什麼絕對的祕密,只是時間窗口問題。大家關注和認可這個賽道,願意投資源、投人力,是重要信號。

各家都希望自產品有優勢,可以找到一個自己擅長的風格,不斷優化,在這個風格上有比較好的表現,也是聰明的打法。但可靈AI的判斷是,如果基礎模型不夠強大,定向優化能解決的問題有限。我們最終希望可靈AI成爲大家內容創作的新基建,能夠囊括更多風格和類型。

Q:在創辦異類Outliers時,你對AI影視市場化前景有什麼樣的判斷?目前公司的商業化是否達到了預期?

陳翔宇:我自己是比較熱血的狀態。聚合一羣人、找到志同道合的夥伴,這是異類Outliers成立的初心,對AI的瞭解是在過程中發生的。

當時有一個合夥人是在CMU(卡內基·梅隆大學)學習人工智能的。我們從底層開始一點點了解架構,結合傳統制作的一些經驗,慢慢找到了一個路徑。當看到一枚寫實人物素材的那一刻,我覺得新時代就要來了。

整個AIGC行業都面臨商業化問題,不僅是我們團隊。短劇、中劇、動畫都有很好的土壤,但AIGC商業化並不健全,我們也在探索過程中。

《新世界加載中》總導演、異類Outliers創始人陳翔宇

Q:目前還沒有明確的路徑?

陳翔宇:有路徑,做好內容就是最好的路徑。

Q:AI生成視頻降本增效的情況如何?

陳翔宇:分不同的評判標準。我們始終認爲好內容是不可量產的,AI產出的作品也不可能和實拍百分之百相似,能夠達到70%或更高,這是我們嘗試達成的目標。

如果以50%或30%的時間、15%~40%的成本,能達到70%的效果,就是有價值的,因爲不同產品面對不同的市場。在這個過程中,需要的人員減少,產量更大,這都是降本增效。

Q:與傳統制作方式相比,AI可以讓哪種內容類型最大幅度地降低成本?爲什麼?

陳翔宇:肯定是科幻。科幻、魔幻、有大場面的奇觀,正常情況下要麼是三維去做,要麼取一個很大的景,需要耗費巨大的成本,AI生成的成本只有幾十分之一。

現實主義短片實拍成本沒那麼高,而且寫實風格會面臨一個問題:觀衆很熟悉肉眼觀察到的世界,AI製作有很小的一點差別,觀衆都能感受到,脫離我們構建的沉浸感。

Q:AI能幫助降低多少時間和資金成本?

陳翔宇:風格、角色量和場景不同,都會影響整體制作時長。但總體來說一定是提效的,大概相當於傳統制作動畫時長的1/3。

資金成本在不同項目中也會不同。拍寫實的成本不會特別高,大場景或科幻類型會大一些。目前通常是傳統製作成本的1/2往下。

Q:技術、內容、IP、資金、發行、宣發等,哪個環節的支持對創作者更重要?

陳翔宇:這是一個偏整體向的問題。

行業整體還處於啓蒙階段,很多有才華的創作者只是一腔熱血,如果沒有合適的商業生態,那創作者到底應該如何存活下去?可靈AI一直在做這件事,我們也在做一些新的嘗試和探索,包括IP打造,近期上線的短片也在市面上有不錯的反響。

這是整個行業要面對的事情,希望能有更好的未來。

封面來源丨《新世界加載中》海報

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10