智通财经APP获悉,中金发布研报称,2024年OpenAI发布Sora,引领视频生成新纪元开启,带来DiT技术路径收敛,也开启了视频生成商业化元年。进入2025年,视频生成美学质量、角色一致性、清晰度、生成效率大幅进步,视频生成已经初步进入影视、电商、广告场景成为生产力工具,各家以垂类SaaS订阅制形成早期商业模式。特别地,中国公司在视频生成赛道优势亮眼:该行预期快手-W(01024)可灵2025年ARR全球领先,商业化也进入快车道。
中金主要观点如下:
技术路径视角,2024年Sora发布后,路径收敛至DiT,未来关注多模态理解生成结合
视频生成在深度学习时期经历图像拼接、自回归扩散等混合路径、DiT主流路径三阶段,2024年Sora发布带来内容生成质量显著提升,海外、国内主流公司均以DiT作为核心架构,OpenAI更新版GPT-4o、中国创业公司Sand AI另尝试自回归路径。面向未来,该行认为多模态基础模型带动视频生成效果优化是主线,多模态生成理解相结合(DeepSeek Janus-pro)、端到端多模态(Google Gemini)是值得追踪的核心方向。
P端和B端共计百亿美元市场空间,中国公司具备垂类机遇
根据 Fortune Business Insights,2024年AI视频生成全球规模约6亿美元,根据该行测算,中期P端和B端生产力工具市场规模有望达到100亿美元,如下探到C端生产力市场则具备更广阔空间,当前处在高成长性赛道的早期阶段。特别地,中国公司模型力可匹敌海外,产品力超越海外。ARR商业化视角,该行测算快手可灵市占率约20%,全球领先,海螺、爱诗、生数在用户和商业化维度均亮眼,内容创作是单点优势的集合,该行预期格局多强并存。
入局者洞察
1)技术维度,收敛至DiT,核心矛盾不再是生成时长,而是一致性和美学;2)产品维度,可灵、海螺、爱诗全球排行榜领先,国内前三;3)产品定位,当前2P+2B专业化用户为商业化主流,是Runway、可灵、海螺、生数主要定位赛道;2C长坡厚雪,爱诗、即梦致力于降低视频生成门槛,打造AI社群生态;4)商业模式,高质量模式单秒价格已在0.4-2元区间,已进入创作者视角的价格不敏感区间,且仍具降本空间。该行认为成本降低或成为商业化拐点的核心指标。
风险
多模态模型能力提升不及预期;视频生成商业化不及预期。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.