智通財經APP獲悉,中金發布研報稱,2024年OpenAI發布Sora,引領視頻生成新紀元開啓,帶來DiT技術路徑收斂,也開啓了視頻生成商業化元年。進入2025年,視頻生成美學質量、角色一致性、清晰度、生成效率大幅進步,視頻生成已經初步進入影視、電商、廣告場景成為生產力工具,各家以垂類SaaS訂閱制形成早期商業模式。特別地,中國公司在視頻生成賽道優勢亮眼:該行預期快手-W(01024)可靈2025年ARR全球領先,商業化也進入快車道。
中金主要觀點如下:
技術路徑視角,2024年Sora發布後,路徑收斂至DiT,未來關注多模態理解生成結合
視頻生成在深度學習時期經歷圖像拼接、自迴歸擴散等混合路徑、DiT主流路徑三階段,2024年Sora發布帶來內容生成質量顯著提升,海外、國內主流公司均以DiT作為核心架構,OpenAI更新版GPT-4o、中國創業公司Sand AI另嘗試自迴歸路徑。面向未來,該行認為多模態基礎模型帶動視頻生成效果優化是主線,多模態生成理解相結合(DeepSeek Janus-pro)、端到端多模態(Google Gemini)是值得追蹤的核心方向。
P端和B端共計百億美元市場空間,中國公司具備垂類機遇
根據 Fortune Business Insights,2024年AI視頻生成全球規模約6億美元,根據該行測算,中期P端和B端生產力工具市場規模有望達到100億美元,如下探到C端生產力市場則具備更廣闊空間,當前處在高成長性賽道的早期階段。特別地,中國公司模型力可匹敵海外,產品力超越海外。ARR商業化視角,該行測算快手可靈市佔率約20%,全球領先,海螺、愛詩、生數在用戶和商業化維度均亮眼,內容創作是單點優勢的集合,該行預期格局多強並存。
入局者洞察
1)技術維度,收斂至DiT,核心矛盾不再是生成時長,而是一致性和美學;2)產品維度,可靈、海螺、愛詩全球排行榜領先,國內前三;3)產品定位,當前2P+2B專業化用戶為商業化主流,是Runway、可靈、海螺、生數主要定位賽道;2C長坡厚雪,愛詩、即夢致力於降低視頻生成門檻,打造AI社群生態;4)商業模式,高質量模式單秒價格已在0.4-2元區間,已進入創作者視角的價格不敏感區間,且仍具降本空間。該行認為成本降低或成為商業化拐點的核心指標。
風險
多模態模型能力提升不及預期;視頻生成商業化不及預期。