文|壹娛觀察 大娛樂家
AI視頻的戰爭,才啱啱開始。
在生成式AI的大航海時代,文字、圖像、代碼的疆界已相繼被重繪,唯獨「視頻」這一最複雜、最昂貴、最具傳播勢能的內容形態,始終處在被技術反覆叩門卻未徹底攻陷的高地。
這個局面,似乎終於要被OpenAI在10月1日推出的Sora2而改變。
如果說今年早些時候的Sora只是一次「從文本到視頻」的早期演示,那麼 Sora2則更像是一次內容範式的重塑:它不僅能生成物理一致性更強、鏡頭語言更成熟的動態畫面,還在音畫同步、環境聲效、人物對白等方面實現了重大突破——AI不再只是「畫面導演」,而是第一次同時擔任了攝影師、編劇、配樂師和演員。
與此同時,OpenAI還選擇將它打包成一個社交平臺級產品——Sora App,而不只是模型本身:創作者可以一鍵生成視頻、上傳人像 cameo、Remix他人作品,甚至像刷TikTok一樣在流裏發現AI內容。

這也是為何,長期對視頻生成持謹慎態度的知名分析師Ben Thompson 態度大變,稱之為「一個可能撼動Meta和Tiktok社交帝國根基的威脅」——Sora不再是技術的展示,而是內容分發邏輯的重塑。
當AI不僅能生成視頻,還能決定「視頻如何被觀看」「創作者如何被推薦」時,整個內容平臺的生態規則都可能被重寫。
面對這股浪潮,中國的科技巨頭們自然不會坐視不理。字節跳動的即夢和快手的可靈作為AI文生視頻工具也已存在多時,並在國內用戶增長和產品功能上迅速迭代,正因如此,當Sora2引爆話題之時,社交媒體上也傳出了大廠國慶連續加班研究的消息。

Sora2 生成視頻
於今其所要面對的問題是,在Sora2已經將「AI生成視頻工具」升級為「AI內容平臺」的今天,誰能最先在國產賽道上拿出可對標的產品?或許這一次的戰略性「對標」,反而能夠為其始終未能找到出路的AI內容真正解套。
01 從模型到平臺:Sora2為何成為「現象級產品」
要理解Sora2所引起的轟動效應,必須先認識到它帶來的,其實並非單純意義上「視頻生成能力」的升級,反而是長久以來對於「AIGC內容」敘事範式的再定義。
首先,Sora2在內容生產的維度上實現了質變。
它最大的突破在於「音畫同步」和「物理一致性」的雙重躍遷:視頻中的光影、重力、碰撞、鏡頭語言都比前代自然得多,甚至連人物對話、背景音效、情緒氛圍都可以自動生成。

Sora2 生成視頻
這意味着AI第一次具備了「編導級」的綜合敘事能力——不僅能「畫出」一個世界,還能「讓這個世界活起來」。在傳統影視行業,這相當於從一支美術團隊變成了一個完整的製作公司。
其次,Sora2的產品形態本身更具戰略意味。
OpenAI沒有讓它停留在「API模型」或「開發者工具」的層面,而是直接推出了Sora App,一個具備創作、分發、互動、推薦等功能的「AI原生內容平臺」。
這一決策背後是對未來互聯網內容生態的深刻洞察:AI不只是生產力工具,更是平臺競爭的新核心。當生成能力與分發邏輯綁定,創作者行為就會被平臺設計重新塑造,生態壁壘也將因此建立。

Sora App截圖
接着,Sora2的「Cameo」功能進一步拉近了人與AI內容的距離。
用戶只需上傳一張人像或一段音頻,AI就能在生成的視頻中「代入」你的形象。「自我投射」的能力,使AI視頻不再只是「看」的內容,而是「參與」的內容。這是「用戶創作行為的徹底重構」——它把創作門檻降到零,同時激活了人類最本能的表達慾望。
最後,也是最具產業級意義的一點:Sora2的社交屬性使其從「工具」變成了「平臺」。
它不再僅僅只是一個AI文生視頻大模型,而是一個內容分發系統;它不只是為創作者服務的API,而是一個可能吸引數億用戶日活的短視頻入口。

Sora App發佈後首周下載量
可以說正是這一架構使其對Meta和Tiktok產生了結構性威脅,因為它有潛力從根本上重塑短視頻平臺的競爭格局——當「視頻生產」本身不再是人的專屬能力,平臺之間拼的就不再只是內容,而是「生成 + 分發」的一體化體驗。
並且,OpenAI可以毫無包袱的去做這件事,畢竟對他們來說,將更具娛樂消費屬性的Sora與生產力屬性更強的ChatGPT區隔開來,反而有助於兩個平臺各自的有效增長。
02 追兵的機會與困局:即夢 vs 可靈
如果說OpenAI的Sora2為全球 AI 視頻賽道樹立了新的標杆,那麼,在中國市場,最有機會追上的,顯然是字節跳動的即夢 與快手的可靈。
兩者都已經邁出了第一步,但前路各有優勢與短板。
從基礎能力看,即夢更像是「產品派」的代表。
它背靠字節的剪映、抖音生態,具備天然的分發入口和用戶場景優勢。即夢的Seaweed模型已經支持文本生成視頻、動作模仿、多模態參考等功能,平臺內還集成了創作、編輯、分享的完整生產鏈條。

即夢AI製作的短片《權利童話》
字節的強項顯然不在於最前沿的模型研發,更多還是依靠產品邏輯做成生態閉環:只要生成質量達到「可用」水平,就可以藉助抖音的流量分發迅速起量。這也是為什麼即夢雖然相對後發,卻同樣能夠快速獲得大批用戶青睞。
它的短板同樣明顯:目前的即夢在音畫同步、物理細節、長時視頻一致性上,仍與Sora2甚至是可靈存在着差距。更重要的是,抖音如此巨大的體量之下,除非是AI視頻的確有什麼巨大突破,否則很難說服大部分用戶必須用即夢來做視頻。
可靈的路線則更偏「技術派」。

可靈AI生成視頻截圖
快手從一開始就強調模型層面的突破:在2.0版本中,可靈引入了多模態視覺語言(MVL)、多圖參考、3D軌跡控制等技術模塊,目標是逐步接近Sora2的生成質量。
更重要的是,可靈已具備生成數分鐘長視頻和複雜鏡頭語言的能力,並開始探索「視頻續寫」「鏡頭編排」等更貼近影視製作的方向。從技術潛力來看,可靈也許比即夢更接近「對標產品」的目標。
然而,快手需要面對的是生態問題:它的分發能力和創作者生態不如字節龐大,平臺對用戶生成內容的承載能力相對有限。換句話說,可靈或許能先跑出「模型層面的對標」,但未必能先跑出「產品層面的平臺」。

可靈AI單元故事集《新世界加載中》
然而,真正制約這場競爭走向的,或許並不是技術,更多還是商業層面的考量。國內AI文生視頻目前最大的困境在於,依然沒有找到真正的商業模式。
根據快手發佈的2025年第二季度財報顯示,可靈AI在該季度的營收達到了2.5億元,較去年有了數倍增長,然而,影響的客戶其實依然還是專業機構或是自媒體。本質上來說,AI視頻生產工具並不屬於大衆消費產品。
即便是過去一年被寄予厚望的「AI短劇」,也沒有演化出一個足夠有規模、有利潤的生態系統。多數項目仍然依賴補貼或營銷預算驅動,無法自我造血,用戶的留存和付費意願也遠未驗證。在這種背景下,如果讓文生視頻作為「功能模塊」嵌入到抖音、快手等主平臺之中,便很難成為業務增長的新支點。

用戶生成的AI短劇
更重要的是,如果讓抖音和快手本體直接承擔AI視頻生產的任務,不僅面臨注意力被稀釋、用戶體驗受影響的風險,也會引出複雜的倫理與法律問題——例如真人視頻與AI視頻的混雜如何標註、內容責任如何界定、算法推薦是否應區分來源等。
正因如此,從產品形態的角度來看,打造一個「只允許AIGC視頻存在」的獨立平臺,不僅是未來競爭的方向,也可能是行業走向成熟的必要條件。
Sora2的出現,讓「AI視頻」從技術演示變成了行業主戰場。它不只是重新定義了「內容怎麼生產」,還在重塑內容如何被分發、創作者如何被激發、平臺如何被重構。

Sora2 生成視頻
對於抖音和快手而言,壓力同樣來源於需要用AI產品來和自己原本的內容平臺打擂臺,這其實是OpenAI所不需要考慮的問題,畢竟它只是從零開始去顛覆,才能夠如此不管不顧。
這倒是也是為什麼按照國內產品「對標」的能力,原本以為加班一個國慶大概就應該已經有類似產品的1.0版本出現,但快兩週過去,大家依然還是熱火朝天的在討論Sora2,卻沒見到兩家大廠的跟進動作。
理論上來看誰願意先做出真正意義上的「國產Sora2」,其實也決定兩家公司各自的AI戰略走向,更重要的是在AI創作內容這個層面,「視頻」始終還是皇冠上的明珠,無法在這一能力上佔得一席之地,其實到頭來也很難說把「AI故事」講完整。