快手提高可靈AI的優先級,組建一級部門

晚點LatePost
昨天

《晚點 LatePost》獨家瞭解到, 快手-W 在今日成立了可靈 AI 事業部。該事業部下設可靈 AI 產品部、運營部和技術部,負責可靈、可圖等系列大模型業務,快手高級副總裁蓋坤擔任可靈 AI 事業部負責人,繼續兼任社區科學線負責人。

與此同時,社區科學線下成立基礎大模型與應用部,負責 LLM 大模型、多模態理解大模型以及應用技術研發。

調整後,可靈 AI 將作爲與主站、商業化、電商、國際化、本地生活並列的一級業務部門,向快手董事長兼 CEO 程一笑彙報。這也是近 3 年時間裏,快手唯一成立的獨立事業部。可靈與可圖分別是快手自研的視頻生成大模型與圖片生成大模型。2025 年 3 月 25 日的快手財報電話會上,快手 CEO 程一笑稱,目前可靈 AI“圖生視頻” 功能的綜合效果處於全球第一。

根據官方數據,自商業化以來至今年 2 月,可靈 AI 累計營業收入已超過 1 億元。我們瞭解到,可靈 AI 今年前三個月的營收,已超過 2024 年下半年的總和。

一位快手人士稱,AI 一直是快手的公司級戰略,此次組織升級,意味着可靈 AI 在快手大模型整體戰略中的重要性進一步提升,團隊能更靈活地發展業務、獲取並調動更多的資源,以保持在視覺大模型領域的競爭優勢。

快手不是國內第一家將 AI 業務升格爲一級部門的互聯網公司。2023 年底,字節跳動組建了獨立於原有組織架構的新部門 Flow 和 Seed,前者做 AI 產品,後者做大模型研發。

另據我們瞭解,就在此次組織架構調整公告發布之前一週,快手內部員工已收到了可靈 AI 的內推及 “活水” 通知,招聘的崗位涵蓋研發、算法工程、產品、運營及商務合作等多個職位。

一位快手戰略人士告訴我們,內部對可靈有很大的期待。在最近的一次內部幹部會上,蓋坤提到,可靈在發展路徑選擇上要優先保證模型效果,並聚焦 P 端用戶(professional creators),要求可靈能在 AI 視覺生產領域可以做到 “全球領先”。他還多次表達了,希望能用 AI 把《三體》的場景復現出來的想法。

快手 CEO 程一笑此前在財報電話會上也提到,AI 大模型有機會極致降低內容創作的門檻和成本,並帶來 AIGC 內容生產數量和質量的爆發式增長,從而形成新的商業模型。

瞄準一個方向,更堅決的投入

快手是押注視頻模型最堅定的中國互聯網公司之一。

據我們瞭解,快手在 2023 年初啓動 AI 戰略並制定了相應目標規劃。當年 3 月底的內部幹部會上,程一笑便提及,AI 是個新時代,對快手來說,推薦和視頻生成領域是發力點。“在下一個十年想在風口找到自己的位置,要做長期而正確的事。” 一位在場的快手人士轉述他的話。

在 2023 年以來的 9 次幹部會上,AI 始終是最高管理層反覆強調的重點話題。“一笑關注 AI 如何賦能現有生態,也提出要加快 AI 創新業務的發展節奏。”

2023 年下半年,快手成立專項,探索視頻生成技術。次年 2 月,OpenAI 的 Sora 問世,快手進一步向視頻生成傾斜開發資源,並很快被定爲了公司級戰略。一位可靈人士告訴我們,程一笑經常關注可靈的業務發展情況,還要求公司優先保障可靈的 GPU 供給。

當時多數互聯網公司的重心都在應用前景更明朗的大語言模型和圖片模型上。即便 Sora 讓行業看到了視頻模型的潛力,“但優先級依舊沒提高多少。” 一位字節跳動大模型研發人士說。

百度 CEO 李彥宏就曾公開稱,不會投入視頻生成模型,他認爲從長期來看,視頻模型無法帶來收益;字節跳動則把多模態的優先級放在了視覺理解和圖片模型上;在騰訊,文本模型也一度被認爲更重要,“因爲這是任何產品都能用上且需要的能力。” 一位混元大模型研發人士說。

2024 年 6 月,可靈大模型上線,這是全球第一個與 Sora 一致採用 DiT 路線,且直接面向普通用戶開放的視頻大模型。“完全沒想到是快手最先做出來。” 上述字節跳動大模型研發人士說。

除了較早開始堅決投入,可靈能迅速嶄露頭角也得益於組織優勢。

可靈大模型是由快手社區科學線的團隊開發的,其中許多成員原本的日常工作就是處理千萬量級的視頻內容,包括對視頻的畫質和內容做分析、標註等,而在做大模型時,“這種能力和工作流程是可以直接複用的。” 一位可靈人士說。比如,團隊只花了很短的時間便完成了訓練數據的規範化處理,並按照需求篩選整合至訓練集中。

相比之下,在不少公司裏,研發大模型的團隊多是新組建的,他們得先花大量時間從零搭建數據處理的管線、重新打磨算法和工程效率。一位頭部互聯網公司視頻模型研發人員告訴我們,團隊組建好後,僅將每日處理的視頻數據量從 1000 萬提升至 2000 萬,就耗費了大半年時間。

根據 AI 基準測試機構 Artificial Analysis 發佈的全球視頻生成大模型榜單,快手可靈 1.6pro(高品質模式)以 1000 分的 Arena ELO 基準測試評分登陸圖生視頻(Image to Video)賽道榜首,Google Veo 2、Pika Art 位居榜單第二、三名。

一位 AI 創業者稱,在各家公司豪擲大模型資源 “軍備” 的階段,快手選擇了一條更能發揮出自身稟賦的賽道並專注投入,這是明智的選擇。

長跑纔剛剛開始

創立於 2011 年的快手最早是一款 GIF 動圖產品。2013 年轉型爲短視頻平臺後,快手的日活躍用戶數在一年時間從萬級上漲到了百萬級。

可靈的出現讓快手看到了,在 AI 時代復刻這個成功路徑的可能性。

2025 年 4 月 15 日,面世不到一年後,快手發佈了可靈 2.0 視頻生成模型及可圖 2.0 圖像生成模型。快手高級副總裁、社區科學線負責人蓋坤在發佈會上稱,兩款模型在團隊內部的多項勝負率評測中,均穩居業內第一。比如在文生視頻領域,可靈 2.0 對比谷歌 Veo2 的勝負比爲 205%,對比 Sora 的勝負比達 367%。

不過一位快手人士稱,內部對於將可靈打造爲一個超級入口並不着急,目前最重要的任務還是將資源投入到研發上,保持可靈大模型和可靈 AI 在技術與產品上的領先,“畢竟以市面上各個視頻生成模型的能力來看,它們連數字媒體市場 20% 的份額都喫不下來。”

各公司對於什麼是 AI 時代超級入口也尚無共識。在字節跳動,由抖音集團原 CEO 張楠帶隊的 AI 創作平臺即夢,其遠期規劃與快手類似——打造一個 AI 時代的抖音。

一位即夢人士稱,內部判斷,至少還要再等 3-5 年纔可能找到 AI 視頻平臺真正應有的形態。據我們瞭解,如今市面上的一衆視頻生成應用,30 日的用戶留存率普遍在 4%-5% 的低水位。“產品的使用者仍然侷限在有創作需求的人,以及 AI 愛好者們。”

對快手來說,復刻一個 AI 時代的快手,也有很現實的挑戰。一位深入研究 AI 的二級市場人士告訴我們,目前的主流 AI 產品如果服務 1 億日活用戶,需要約 40 萬張卡的算力,這大約對應十個新的算力中心。對多數公司來說,這是一筆不小的開支。

一位快手人士說,今年 3 月,蓋坤在可靈 2.0 發佈前的公司幹部會上強調了 “保持模型效果持續領先” 的重要性,同時在營收規模上,也提出了 2025 年要實現 “跨越式增長” 的目標。

在這場長跑式的競爭裏,快手要保證可靈的模型能力和 “造血” 能力的始終領先,這並不容易。

目前行業內對視頻模型的技術路線仍存在爭議。一位字節跳動 Seed 人士稱,當前視頻生成技術雖與文本模型使用相似的底層架構,但缺乏對內容的真正理解能力。

可靈 2.0 模型發佈會上,蓋坤也表達了類似的觀點,“儘管 AI 在輔助創意表達上擁有巨大潛力,但當前的行業發展現狀還遠遠無法滿足用戶需求。” 他當時提出了一個新的視頻生成的交互理念 Multi-modal Visual Language(MVL),稱希望用戶可以藉此更自由地引入文字、圖片、視頻等多模態信息,生成符合想法的創意視頻。

無論如何,“可靈還是帶給了快手久違的興奮感和戰鬥力。” 一位快手人士說,“影視、廣告和互聯網行業裏,可靈都在加速滲透。”

十二年前,快手從 GIF 社區轉型短視頻社區,抓住了移動互聯網時代的機會,如今成爲了中國總流量排名第三的應用程序。“在一笑看來,AI 是一次全新的起點,大概率將再次給各公司與產品帶來躍升的機會,這是快手一定要抓住的。” 上述快手人士說。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10