文|蛇眼财经v
2024年初,OpenAI公布的Sora AI视频生成模型,震撼了国产大模型行业。随后国产厂商集体发力视频大模型,快手发布视频生成大模型可灵,字节跳动发布豆包视频生成模型,正式打响了国内AI视频生成领域第一枪。
众多企业匆忙入局,只为在这片新兴市场中抢占先机,却往往忽视了技术成熟度与应用规范的打磨。
以社交平台上泛滥的AI伪造视频为例,全红婵家人被恶意仿冒博流量卖货,明星们也纷纷中招,刘晓庆、张馨予等均曾反馈有人在视频号上通过AI生成视频假冒她。这些伪造视频不仅严重侵犯他人权益,更在商业利益的驱使下,充斥着虚假营销,让不明真相的消费者屡屡受骗。
AI视频生成领域正处于应用爆发前夜,快手、字节等业内玩家试图通过技术迭代推动产品破圈,却也陷入了无序竞争困境。
AI视频赛道尚未成熟
当前,AI视频生成赛道看似热闹非凡,实则整体仍处于不成熟的初级阶段。
尽管各大厂商拼命投入资源,力求在模型性能指标上不断突破,从生成时长的延长到画面质量的优化,看似让AI视频生成赛道加速迈进“技术突破期”,但AI视频技术应用仍有不完善之处。
以快手和字节跳动为例,快手于近期发布了可灵2.0视频生成模型及可图2.0图像生成模型,自2024年6月6日首次上线开放测试以来,可灵AI已快速迭代二十余次,其模型在动态质量、语义响应、画面美学等维度表现出色。
字节跳动的Seed团队也推出了Seedream 3.0,据第三方榜单Artificial Analysis显示,Seedream 3.0综合性能追平文生图SOTA模型GPT-4o,进入全球第一梯队。
然而,这背后也暴露出AI视频生成领域存在的诸多问题。
一方面,部分企业为了在竞争中脱颖而出,过度追求技术迭代速度,而忽视了产品应用的实际情况,使得AI视频生成技术在实际应用中漏洞百出。
例如,当用户输入“敦煌飞天”时,AI可能生成面部扭曲的虚拟形象;要求制作科普视频时,常出现违背物理规律的悬浮物体。据MIT媒体实验室测试,当前主流AI视频模型在复杂叙事连贯性上的准确率不足63%,这严重制约了AI视频生成技术在商业应用中的边界。
另一方面,随着技术的快速发展,版权问题逐渐凸显,成为AI视频生成领域的一大“雷区”。
当AI融合多个版权素材生成新内容时,现有的“合理使用”原则已难以适用,这让企业在版权问题上面临着巨大的法律风险。从Getty Images起诉Stability AI使用其版权图片训练模型,到日本漫画家协会禁止使用AI生成分镜,再到全球首个AI视频版权案判决金额高达2.3亿美元,版权问题仍未得到合理解决。
更值得关注的是,当前的AI视频生成技术虽然在画面质量、生成速度等方面取得了显著进步,但在视频内容的逻辑连贯性、情感表达深度以及对复杂场景的理解等方面仍存在较大不足,无法完全满足市场对高质量、多样化视频内容的需求。
由此可见,快手想要让可灵AI成为营收规模全球第一的视频生成AI应用,这条路任重道远。
字节与快手“抢滩”
当前AI视频生成领域风起云涌,字节跳动与快手作为行业内的两大巨头,正在AI视频赛道上奋力抢滩,二者策略各有侧重,呈现出别样的竞争态势。
快手主张商业化先行,打造多元变现模式,已在AI视频生成领域取得了令人瞩目的成绩。
在技术方面,快手可灵AI展现出了强大的实力,为其商业化拓展提供了坚实的技术支撑。据全球知名AI基准测试机构Artificial Analysis发布的榜单显示,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频赛道榜首,超越了Google Veo 2、Pika Art等强劲对手。
在商业化方面,快手无疑走在了前列。可灵AI采取了“C端订阅+ B端API服务+定制化场景解决方案”的多元变现模式,既满足了个人用户的创意需求,又为企业客户提供了强大的视频生成工具。
据了解,可灵视频大模型全球用户规模突破2200万,吸引了来自世界各地的超1.5万开发者和企业客户,将可灵的API应用于不同的行业场景中。截至2025年2月底,可灵AI的累计营业收入超1亿元。
字节跳动则展现了不同的野心和策略,其对AI视频生成的布局更侧重于对AGI(通用人工智能)的探索。
年初字节跳动豆包大模型团队在内部组建了代号为“Seed Edge”的AGI长期研究团队,鼓励项目成员探索更长周期、不确定的和大胆的AGI研究课题,目标是探索AGI的新方法,并鼓励跨模态、跨团队合作。
字节跳动近期发布的Seaweed-7B模型,以其音画一体生成、长镜头生成、实时生成等多项前沿技术。该模型能够在短短25秒内生成高质量的视频内容,且推理速度比同类模型提升62倍,其性能与Wan 2.1-14B相当,在文本转视频的任务中,Elo评分仅次于排名第一的模型Veo 2。
相比于快手的商业化先行,字节跳动更注重在技术层面的深耕和突破,试图通过解决AGI这一终极难题,来实现其在AI视频生成领域的长远发展和全面领先。快手需要在保持商业化优势的基础上,进一步加大技术研发投入,提升AI视频生成的质量和效率,以免被字节跳动抢了“风头”。
更大的目标和挑战
AI浪潮汹涌,快手正试图借助AI之力重塑自身商业版图,AI视频生成赛道只是其宏伟蓝图中的一部分。
从快手的营收数据来看,2024年总营收同比增长11.8%至1269亿元,经调整净利润大幅增长72.5%达177亿元,线上营销服务和其他服务收入同比增长率均超20%,亮眼的成绩背后,AI成为了关键的增长引擎。
快手设定的AI目标很宏大,其面临的挑战也全方位且极为严峻。
一方面,快手计划持续强化AI技术对原有商业生态的改造,为线上营销服务和电商业务开拓新的增长空间。
理论上AI可以精准分析用户需求,为商家提供更有效的营销方案,但实际操作中却困难重重。在内容生产环节,AI更多只能起到辅助作用,无法从根本上解决内容质量参差不齐的问题;在经营成本方面,AI技术的引入可能会在一定程度上降低某些环节的成本,但同时也带来了新的成本,如技术使用成本、数据安全维护成本等。
另一方面,快手全力升级以可灵为代表的AI商业化变现模式,试图将可灵AI打造成为全球1200亿美元视频创作市场的AI基础设施,进而实现从“中国第二大短视频平台”到“AI视频生态领军者”的华丽转身。
这无疑是一场豪赌。构建基础设施意味着要具备强大的技术通用性、稳定性以及广泛的市场认可度,快手需要投入海量的资源用于技术研发、生态建设与市场推广。而当前行业内,技术标准尚未统一,市场格局分散,快手在推动自身技术成为行业标准的过程中,必然会遭遇来自各方的阻力。
机遇与挑战并存,如果快手不能在技术研发、商业策略以及行业责任担当等方面做出深刻调整与优化,那么其所谓的“AI视频生态领军者”的愿景,很可能只是镜花水月,最终在激烈的市场竞争与行业变革中被无情淘汰。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.