对话快手可灵丨AI 新世界加载中,我们还能做些什么?

市场资讯
Yesterday

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

无情的迭代机器

作者丨高珮莙

远古猎人王涵因为一次雷电患上了“马丁症”,每隔24小时,他的意识就会穿越到不同人的身体里。为了找回和保护女儿,他在两千年的时间里不断穿越,当过将军、富翁、宇航员,却始终无法停留。

一只被基因改造的流浪狗“李”,在霓虹闪烁的都市孤独地生存,始终无法走出过去被背叛的噩梦。直到遇到一位同样是实验体的小女孩,收获了爱与温情,并为了她勇敢地对抗邪恶组织。

这些充满科幻和奇幻色彩的故事,来自6月25日在北京举行首映礼的AI单元故事集《新世界加载中》,由7个各自独立的剧集故事组成,时长共180分钟。

新世界加载中》首映礼现场

雪豹财经社在首映礼当天观看了其中三部剧集。以看惯了大银幕和爆款剧的挑剔眼光来看,它当然并非无可挑剔:一些非关键人物的动作稍显僵硬,对口型的准确性有待提升,部分情节的逻辑略显跳跃,以及片长限制导致的背景和情感铺垫不够完整。

但如果考虑到这部短片集的核心“创作者”——可灵AI,是一个正式发布才一年的“孩子”,它在某些方面的表现的确可圈可点,甚至堪称惊艳。

比如,水流的波动和动物毛发的纹理质感真实自然,长镜头下的人物表情变化细腻,在一段二维动漫风格的连续打斗戏中,动作衔接连续流畅。

《新世界加载中》海报

这也是可灵AI产品及运营负责人李杨和《新世界加载中》总导演、异类Outliers创始人陈翔宇的一致判断:AI生成视频距离高水准的大银幕制作还有距离,但用AI工具创作的不同题材的作品,已经开始渗透到人们的日常生活中。

从2024年年底开始,一系列由AI“魔改”的宠物视频在各大社交平台上爆火,狗狗跳舞、猫猫做饭成为被津津乐道的谈资。一些短剧导演开始用AI制作打斗、战争、大空镜等画面,极大地节约了成本和时间。陈翔宇透露,AI制作动画的工时约为传统制作方式的1/3,成本则不到1/2。

未来它将在广告、游戏、影视等更大的行业扮演什么样的角色?目前还没有明确的答案,但一些共识已经形成:AI也许会带来颠覆性的改变,那将是一个有巨大潜力的市场。

《新世界加载中》的片名,显然就是这样一个有意而为之的巧妙双关。“《新世界加载中》是我们和可灵发出的第一声信号。”陈翔宇说。

2024年6月6日,快手的视频生成大模型可灵AI正式上线,只比OpenAI的Sora晚了不到4个月。据快手CEO程一笑介绍,该项目从当年年初就开始内部孵化。

过去一年来,可灵AI快速迭代了22次,与此同时,国内外巨头们也在加速入场,如今已呈现百花齐放的行业格局。Meta在去年10月首次推出Movie Gen,阿里的通义万相在今年1月升级推出万相2.1视频生成模型,字节跳动的即梦AI在3月完成著作权登记。5月,谷歌Veo 3在 Google I/O 开发者大会上正式发布,凭借音画一体化生成的功能引发外界关注。

在 Artificial Analysis 视频生成榜单中,可灵系列与谷歌Veo系列分别占据文生视频、图生视频的全球前二;东方证券将二者技术实力归类为T0梯队,特别是在稳定性、运动表现等维度的表现。

截至目前,可灵AI全球用户规模突破2200万,拥有超1万名开发者和企业用户。今年一季度,可灵AI营收超过1.5亿元,其中来自P端(Prosumer,产消者,兼具生产与消费双重角色的主体)订阅用户的贡献近70%。

只不过,在新世界到来之前,技术的迭代提升、创作者生态的搭建、商业化路径的探索,都还是需要持续攻克的难关。

首映礼当日,可灵AI产品及运营负责人李杨和《新世界加载中》总导演陈翔宇在一场媒体群访中分享了他们的感受和思考,雪豹财经社受邀参加了交流环节,以下是对话节选(内容经摘编):

左一为陈翔宇、左二为李杨

Q:今年可灵在技术上有哪些突破?

李杨:从去年到现在,可灵AI一直扎实地做基础模型,围绕几个重要的点有很大提升:一是语义遵从,让模型更听话;二是运动表现,包括运动的速度、质量、美感、自然度、是否符合物理规律。2.1模型的运动表现非常好,创作者挑战了很多高速运动和极致的互动表现,效果还不错。

依托可灵2.1模型生成的视频

Q:可灵AI全球用户量突破2200万,专业创作者占比如何?

李杨:有一定专业创作能力的用户占比还是非常高的。今天的AI创作不是一键生成,没有那么简单,如何写Prompt、如何调和生成自己脑海中的效果,都非常考验专业性和韧性。

Q:可灵AI是如何考虑下一阶段产品形态的?

李杨:行业里有很多Agent或工作流,总体还不太成熟,用户更多地看到炫酷的过程,而不是真正完整的可用结果。可灵做产品的核心出发点还是看交付结果。

基于这样的导向,接下来会有更多产品形态,也会基于已有的模型和功能做更多探索。我们不会贸然去follow一些听起来很时髦的、概念性的产品,还是扎实解决用户真实的问题。

Q:未来商业化有多大的想象空间,今年有什么目标?

李杨:我们已经看到AI在短剧制作行业的一些可能性,它本身又是近几年增速最快的内容类型,如果不断提升工具的专业能力和行业渗透率,还是有比较大空间的。最近经常有一些短剧导演跟我说,之前他们拍宫廷剧得去横店蹭镜头,最近都用可灵AI生成大空镜以及打斗和战争场面,这是一个很有力的帮助。

目前可灵AI服务相对专业的P端人群,未来想要有更大规模,一定会做破圈这件事。这要求有更好的基模、更简单的产品形态和更明确的价值导向、场景导向,让普通用户也能用起来。可灵AI平台上已经有一些特效模板,比如冲浪,C端用户可以用它做一些新奇、有趣的内容创作。

我们确实有一些商业化目标,但目前这些数字更多地还是印证市场和用户需求的可能性,单纯说数字没什么意义,因为行业还在早期阶段。

Q:有一种说法是,现阶段各个模型在功能上都没有什么短板,拼的是长板,可灵的长板是什么?

李杨:我不觉得今天模型没有短板,短板挺多的,各种各样,还没有到达“短板不重要、长板足够长”的状态。视频画面和表达是多元素构成的,包括语义遵从、运动表现等,要做一个六边形战士,各个方面都要好。

可灵AI起步很早并快速迭代,创作者普遍认为它综合表现很好。可灵AI非常擅长写实风格的表达,也看到一些评价说可灵运动上限最高,因为做动态视频,运动非常核心,可灵在这一块有优势。

Q:对未来有什么样的预期?

李杨:坦率地说,不管是可灵还是其他视频模型,大家起跑速度和起点不一样,但都在同一个大范围内。未来还有非常多要做,包括模型的基础表达、稳定性、可控性,达到某一个点之后才会长出更多产品形态,这是前提。

我希望未来AI创作这件事情尽可能再简单一点。我经常开玩笑说,我们这个产品有时挺反人性的,创作者在电脑上打开无数个页面,跑无数张图,不断地抽卡,其实挺痛苦的。希望基础模型能力更扎实,多模态能力更好地融入到产品当中,用户可以用一种更简单的方式表达自己的想法。

Q:谷歌Veo 3发布之后,音频生成同步能力、场景理解及结合YouTube的视频数据比较占优势,可灵会从哪些方面进行追赶?

李杨:谷歌Veo 3是非常不错的模型,可以实现文本生成视频带音效,展现了非常强的技术能力。但另一方面,它也带来了一个问题:不可控或不可保持一致性的东西又多了一个,叫音色。可灵AI依然坚持初心,希望首先把基础模型做好。视频模型虽然发展很快,但还是有很大优化空间,包括运动模糊、边缘模糊、群像人脸崩坏、稳定性等问题,也包括AI音效的能力,这些基础能力我们在不断优化。

好的数据一定对模型有价值,Veo 3用YouTube的数据,就像找到了“数据石油”。但模型迭代除了算力、数据、算法以外,更重要的还是要尽早跟用户有交互,了解用户有什么需求,尽早迭代和上线用户需要的功能。

Q:字节说即梦收费是全行业最低,你们会调价吗?

李杨:从行业趋势看,每过一段时间,推理成本会大幅下降。从市场来看,未来不管是可灵AI还是其他模型,用户的使用成本都会逐步降低,这是大趋势,而且可灵会做得更激进一点。

可灵最新发布的2.1标准版和专业版Pro,性价比非常高,5秒视频3.5元,合0.7元每秒,而友商普遍在1元每秒甚至更高。我们还是希望把好的技术、产品带给用户。

Q:各模型厂商都为P端用户提供技术、资金、宣发等支持,可灵的优势在哪里?

李杨:可灵AI从发布第一天起,就非常关注创作者的反馈和交互。除了资金、技术、宣发支持以外,我们还在去年7月第一个上线了未来合伙人计划的模型平台,希望帮助创作者找到更多商业化的机会,也能够帮IP和品牌广告主匹配更合适、更有创作能力的创作者。因为只有创作者活得好,我们才能够共同建立一个更好的生态。

可灵AI运营团队跟超级创作者也保持了非常紧密的配合,在圈子里认可度比较高,产品和模型迭代离不开创作者的反馈。

Q:可灵AI在行业中处于什么样的位置?

李杨:大模型是一个“高危”行业,非常卷,恨不得一觉睡起来就又有大模型颠覆你。但可灵AI从去年到现在一直保持Tire 1水平,一直在第一梯队。虽然现在其他家模型在陆续发布和迭代,都很不错,但我们综合实力非常强,而且是无情的迭代机器,还会不断优化。

Q:今年的模型迭代走向了一个平稳和你追我赶的阶段,这种状态会持续多久,转折点会在哪里?

李杨:这是一个正向的信号,因为行业在技术上没有什么绝对的秘密,只是时间窗口问题。大家关注和认可这个赛道,愿意投资源、投人力,是重要信号。

各家都希望自产品有优势,可以找到一个自己擅长的风格,不断优化,在这个风格上有比较好的表现,也是聪明的打法。但可灵AI的判断是,如果基础模型不够强大,定向优化能解决的问题有限。我们最终希望可灵AI成为大家内容创作的新基建,能够囊括更多风格和类型。

Q:在创办异类Outliers时,你对AI影视市场化前景有什么样的判断?目前公司的商业化是否达到了预期?

陈翔宇:我自己是比较热血的状态。聚合一群人、找到志同道合的伙伴,这是异类Outliers成立的初心,对AI的了解是在过程中发生的。

当时有一个合伙人是在CMU(卡内基·梅隆大学)学习人工智能的。我们从底层开始一点点了解架构,结合传统制作的一些经验,慢慢找到了一个路径。当看到一枚写实人物素材的那一刻,我觉得新时代就要来了。

整个AIGC行业都面临商业化问题,不仅是我们团队。短剧、中剧、动画都有很好的土壤,但AIGC商业化并不健全,我们也在探索过程中。

《新世界加载中》总导演、异类Outliers创始人陈翔宇

Q:目前还没有明确的路径?

陈翔宇:有路径,做好内容就是最好的路径。

Q:AI生成视频降本增效的情况如何?

陈翔宇:分不同的评判标准。我们始终认为好内容是不可量产的,AI产出的作品也不可能和实拍百分之百相似,能够达到70%或更高,这是我们尝试达成的目标。

如果以50%或30%的时间、15%~40%的成本,能达到70%的效果,就是有价值的,因为不同产品面对不同的市场。在这个过程中,需要的人员减少,产量更大,这都是降本增效。

Q:与传统制作方式相比,AI可以让哪种内容类型最大幅度地降低成本?为什么?

陈翔宇:肯定是科幻。科幻、魔幻、有大场面的奇观,正常情况下要么是三维去做,要么取一个很大的景,需要耗费巨大的成本,AI生成的成本只有几十分之一。

现实主义短片实拍成本没那么高,而且写实风格会面临一个问题:观众很熟悉肉眼观察到的世界,AI制作有很小的一点差别,观众都能感受到,脱离我们构建的沉浸感。

Q:AI能帮助降低多少时间和资金成本?

陈翔宇:风格、角色量和场景不同,都会影响整体制作时长。但总体来说一定是提效的,大概相当于传统制作动画时长的1/3。

资金成本在不同项目中也会不同。拍写实的成本不会特别高,大场景或科幻类型会大一些。目前通常是传统制作成本的1/2往下。

Q:技术、内容、IP、资金、发行、宣发等,哪个环节的支持对创作者更重要?

陈翔宇:这是一个偏整体向的问题。

行业整体还处于启蒙阶段,很多有才华的创作者只是一腔热血,如果没有合适的商业生态,那创作者到底应该如何存活下去?可灵AI一直在做这件事,我们也在做一些新的尝试和探索,包括IP打造,近期上线的短片也在市面上有不错的反响。

这是整个行业要面对的事情,希望能有更好的未来。

封面来源丨《新世界加载中》海报

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10