上市之门展现出重启的征兆,而抖音的现有业务却已经耗尽了想象力。幸运的是,迎面驶来的时代快车 ChatGPT上,装载的全是故事。
2月9日,有媒体爆料称,抖音旗下的人工智能实验室(AI Lab)正在开展类似ChatGPT和AIGC(人工智能生成内容)的研发,未来将为VR(虚拟现实)部门PICO提供技术支持。
PICO相关负责人随后回应称,相关传言不实,PICO目前没有采用类似ChatGPT技术的产品规划。
ChatGPT是一个由美国人工智能科技公司OpenAI推出的大型语言预训练模型,去年11月底上线。凭借看似无所不知、无所不能的AI聊天能力,ChatGPT短短三个月就吸引了超1亿活跃用户,也促使科技公司争先恐后扎身同一条赛道。
在美国,长期押注OpenAI的微软成为ChatGPT全球浪潮的最大赢家,今年1月底宣布再向该公司投入100亿美元,并计划在Office、Bing等核心产品中植入相关功能;深感搜索引擎遭遇史诗级挑战的谷歌,也在2月初匆忙上线对标产品Bard。
国内科技公司中,BAT争相入局。百度2月7日宣布将推出类ChatGPT应用“文心一言”,预计3月完成内测、面向公众开放;腾讯宣称在ChatGPT和AIGC相关方向已有布局;阿里也放出达摩院版本ChatGPT正在内测的消息。次一级的中小玩家也不甘落后,京东、知乎、快手、小米、360等公司都和ChatGPT产生了或远或近的关联。
作为中国互联网的第三极,抖音2016年就设立了人工智能实验室,追赶这波ChatGPT的热浪顺理成章。同时,PICO是抖音元宇宙的探路急先锋,倘若将元宇宙和ChatGPT两大热点勾连起来,即便找不到应用场景,也有助于进一步打响品牌、提升销量。
但对于抖音而言,ChatGPT及其背后的通用人工智能的价值远不止于此。无论是为了中短期的上市,还是长期的互联网技术代际竞争,抖音都需要自己的ChatGPT。
抖音上市筹谋已久,但靴子迟迟未能落地。进入2023年,中概股及互联网行业转暖,尤其是蚂蚁集团基本完成整改,以及滴滴恢复上架和新用户注册,都给整个产业注入新期待。而抖音去年已经完成集团更名、CFO更换等多项关键动作,今年重启IPO恰逢其时。
但尴尬的是,抖音目前盘子很大,但要么是逐渐步入成熟期的老业务,比如抖音APP、今日头条等,要么是扶不起来的阿斗,比如教育、游戏等;集团发力点也集中在能够迅速带来现金流的业务上,比如货架电商和生活服务等。以抖音的底子,这些业务固然能够贡献收入,但都属于一眼望到头的生意,缺少超越时代的想象空间,难以让投资人感到兴奋。
倘若抖音趁着这波ChatGPT的空前热度,拿出自己的通用人工智能路线图,哪怕暂时只是一张大饼,也极有可能在一级二级市场上掀起浪花,给不断下滑的公司估值带来提振。百度、知乎等公司股价飙升,已经验证了资本市场对于ChatGPT概念的追捧。
从长远来看,以ChatGPT为代表的AI技术,将是抖音完成技术底座升级的钥匙。
抖音一直借助中心化算法进行图文和视频内容分发,但如今算法的效率正在逼近极限,反映到业务上就是抖音、今日头条等主要产品增长放缓甚至停滞。再考虑到互联网新用户红利枯竭,抖音只有从底层做出改变,才能让内容池和用户池的联通更加精准高效,进而重启整个生态的增长引擎。
ChatGPT背后的AIGC恰好具备这种潜能。它借助人工智能完成了对存量非标准化信息的海量整合,并以自然语言聊天方式实现了更精细的个性化分发。这是抖音尚未涉足的信息分发路径,也是它需要在推荐算法之外增添的新引擎。
抖音从机器推荐向机器人推荐跃升,除了业务层面的价值外,也是在战略层面上抵御人工智能对于机器算法的降维打击。ChatGPT引领着的通用人工智能浪潮已经到来;而应对浪潮的最佳方式,就是成为它的一部分。
抖音很早就注意到了类似ChatGPT的技术风向,却起了个大早、干了个晚集。
2019年7月,抖音人工智能实验室负责人李航在一场演讲中谈到,自然语言对话存在不错的发展机遇,从产品设计角度可以重点考虑四个机会,包括:任务驱动的对话机器人,信息类机器人,情感类机器人,以及游戏类机器人。其中,“任务驱动的对话机器人”的理想形态已经与今天的ChatGPT十分接近。
同一个月,大洋彼岸的OpenAI实现了公司化转型后的第一个重大突破,拿到微软10亿美元投资,同时也借助微软Azure云计算平台打通了商业化路径。
可以说,在自然语言大模型研究方面,抖音AI技术人员颇有前瞻性,对其产品形态的预测也和日后发展相吻合。而在资金方面,抖音虽然不及微软,但也已经是中国互联网新贵,掏钱支持AI研究不在话下。
然而,与OpenAI可以心无旁骛地all in通用人工智能相比,抖音人工智能团队的KPI要繁杂得多,越来越多地趋向与业务部门打配合。这最终导致两者的成长曲线天差地别。
从公开信息来看,抖音对于AI技术在集团内部落地有着明确要求。它的人工智能实验室官网宣称,自己的研究重点是开发为字节内容平台服务的新技术;具体领域则包括自然语言处理、数据挖掘、计算机视觉、机器学习等,且和抖音各业务板块贴合紧密。
比如,在自然语言处理这块,网站列出了几个应用场景:Byte Translator,为字节跳动所有产品提供翻译服务;AI写稿机器人Xiaomingbot,涉猎体育、金融、时事的新闻写作机器人;以及头条和抖音的搜索服务。而在计算机视觉方面,抖音将AI技术运用在内容审核、短视频推荐系统、足球比赛理解和尬舞机等方面。
相比之下,OpenAI在诞生之初就把目标放在了通用人工智能上,也就是让机器能够像人一样思考、从事多种多样的活动。如果说抖音做AI是为了某一应用场景而研发技术,那么OpenAI恰恰相反,它首先试图让AI变得尽可能像人,至于能够做什么事,完全留给市场和公众去探索和检验。
其结果是,抖音AI部门虽然近几年成果不少,但整体集中在集团内部,尚不具备打破圈层的划时代技术力。而在许多时候,即便是抖音自己,对于自家AI能力的运用也并不算纯熟。
以自然语言处理为例,这是抖音AI团队的重点研究对象之一,而集团也在2017年前后试图扶持悟空问答,并连续两年投入10亿元补贴答主。但在这场并不成功的问答社区攻坚战中,抖音AI并未发挥显著功用,仅仅疑似在热点问题自动生成方面起了一点儿作用。
应用场景受限,又反过来拖累了技术实力的提升。根据市场研究公司statista的统计,2021年全球持有AI专利最多的7家公司中,腾讯、百度和IBM位居前三,而抖音并未上榜。
另一边,OpenAI一年一个台阶,与谷歌交替站在全球人工智能行业的顶峰。从2018年期,GPT(生成式预训练变换器)模型经过三次迭代,其中GPT-3模型在微调之后,成为如今的ChatGPT,几乎可以生成任何类型的文字,包括聊天、问答、论文、营销方案、诗歌、剧本甚至代码,拥有了近乎无穷无尽的应用可能。
在最新一轮融资中,OpenAI的估值达到290亿美元,约相当于1/10个抖音,且增长前景远未看到尽头。ChatGPT大火,或许会促使抖音重新审视自身的AI战略,并给AI团队更多时间和空间。
倘若抖音发力通用人工智能,集团内部的直接受益者当属今日头条。
今日头条发展至今,增长空间已经极为有限,负责人多次更迭。但它毕竟是整个抖音的龙兴之地,同时也是第二大活跃用户池,数亿MAU无法轻言放弃。
过去一两年间,抖音试图从供给侧激活今日头条,围绕创作者生态做文章,主要是提供更多的流量激励和现金补贴等。这类活动或许能够发挥局部效用,但无法真正改写今日头条增长基本停滞的大局。
根本问题在于,今日头条用户在被平台推荐算法“投喂”多年后,沉浸于信息茧房之中,越来越难以对那些超越认知和口味的内容产生兴趣。这种需求侧的活力下滑,很容易导致任何运营动作的效能大打折扣。
要想打破僵局,抖音必须在需求侧做出改变。它之前试图做问答、搜索等,都是希望让用户更加主动地获取信息,而非单纯等着平台上菜。但受限于各种短板,抖音的这些尝试并未取得显著成效。
如今,ChatGPT的爆红,让抖音看到了激活今日头条内容池、提升用户活跃度的新路径。
先看内容侧。自然语言大模型需要巨量文本数据进行训练:OpenAI的GPT-1的数据规模为4GB,GPT-2增至40GB,GPT-3膨胀至2TB。一般来说,数据多、质量越高,最终训练出来的模型的能力也就越强。
对抖音而言,这意味着今日头条沉淀十年的内容池突然有了广阔的应用前景。作为网络资讯,这些内容很多已经丧失了时效性,但由于不少内容具备较好的文本和信息价值,仍不失为大模型训练的养料,继续发挥余热。
再看用户侧。抖音擅长的算法推荐能够洞察用户喜好,却难以察觉人类获取结构化信息和系统知识的高层次需求,这也是它做不好问答的底层原因之一。
但ChatGPT开辟了一种新的信息获取范式:用户设计和提出问题,由AI整合梳理内容,并以用户期待的形态即时反馈。它提供的体验迥异于算法推荐、搜索和问答社区等旧工具,同时又在效率和准确度上有了显著提升。这种基于通用人工智能的个性化信息整合输出能力,是抖音提升图文用户活跃度的终极秘钥。
更长远来看,ChatGPT这样的大模型除了应用在文本信息方面,也必然向图片、音频、视频等富媒体形态延展。抖音倘若做出自己的ChatGPT,受益者除了今日头条,也将是整个抖音阵营。
以“图文转视频”功能为例,知乎此前已经推出基于文本产出视频的功能,但效果差强人意;抖音也已经支持输入文字、搭配图片生成短视频,但AI在其中的运用并不多,成品质量主要取决于创作者自身。
人工智能有望改变这一现状。OpenAI此前发布了基于文本生成图像的模型DALL-E,国内的腾讯、百度等公司也上线了自己的AI绘图工具。抖音2022年发布了基于开源模型的AI绘画功能,累计近2800万人使用。对于通用人工智能而言,从生成文字到图片,再到视频,不过是一步之遥。
对于抖音集团而言,加码通用人工智能,即便暂时搞不出来ChatGPT同等量级的成果,也能带来资本市场所渴求的新故事,进而为上市增添筹码。毕竟,这一动作本身就表明,抖音并不是一家只专注于“去肥增瘦”的普通公司,仍然保有探索科技前沿的野心和能力。
不过,通用人工智能的研发需要耗费大量时间,每年的资金投入也以亿计。这对于花钱愈发谨慎的抖音而言,是一个不小的负担。
根据业内人士估算,目前大语言模型的单次训练硬件成本已经突破3000万元人民币,且仍在随着模型体量的放大而攀升。再加上其他成本,各大巨头需要准备百亿美元,才能最终决出胜负。
即便是有微软撑腰的OpenAI,也不得不在模型精度和成本之间做出平衡。它仅仅对GPT-3训练了一次;尽管AI模型存在错误,但OpenAI认为成本太高,没有再次训练模型。
作为一家中国公司,抖音还面临着先进芯片难以获取的问题。目前,英伟达是全球主流大预言模型开发者的主要芯片供应商,其客户包括微软、谷歌、Meta等。但受地缘政治因素影响,中国企业越来越难第一时间买到最先进的芯片,在模型训练等方面势必遭遇掣肘。
与百度、腾讯、阿里等公司一样,抖音想要做出与ChatGPT等量齐观的产品,可谓难上加难。但倘若能够杀出一条血路,其回报也将是巨大的。
对于抖音而言,一个拥有自主知识产权的自然语言大模型,除了能够给今日头条及其他板块带来飞跃外,还能向外输出AI底座能力,构建商业模式闭环。无论是内容创作、客户管理,还是代码编写、重复工作替代等,都可以发掘出大量应用场景。
以ChatGPT为例,除了充当免费的聊天机器人外,它还作为AI组件融入了微软Office等众多第三方产品,并通过API(应用程序接口)链接中小开发者,由后者探索出更多玩法。2月初,ChatGPT还上线了付费版本,用户可以支付20美元月费,从而在高峰时段访问聊天机器人。
母公司OpenAI已经从中获得不少收入。该公司预计,2023年营收将达到2亿美元,2024年将超过10亿美元。抖音倘若做出自己的ChatGPT,在前期的高投入之后,商业变现之路也会很快越走越宽。
不考虑财务因素,发展自己的通用人工智能,也是抖音避免沦为时代“恐龙”的必由之路。
ChatGPT横空出世后,整个科技行业都看到了AIGC的强大威力,互联网内容生态有可能被改写,直接感受到威胁的谷歌和百度马上官宣了类似产品。与两家公司相比,抖音已经完成从图文到视频的跃迁,ChatGPT至少目前威胁不到它,但并不意味着可以高枕无忧。
抖音的看家本领是推荐算法,它之所以击败了传统门户和视频网站,靠的是“机器取代人工”所带来的效率和体验提升。但推荐算法也面临着一个更加强大的对手——AI,后者以“机器人取代机器”,能够更准确地实时掌握用户需求和反馈,从而让信息分发更精准和高效。
就像当年算法推荐对于人工编辑的降维打击一样,通用人工智能相对于算法推荐也是另一个维度的存在。如今,它通过ChatGPT初露峥嵘,就已经显露出颠覆旧格局的巨大潜能。
对于握有互联网信息分发权的抖音而言,冲击浪潮虽尚未到来,但已经在路上。倘若无法避开来自下一个时代的冲击,那么最好的应对方式,就是成为下一个时代的一部分。尽快上马自己的ChatGPT,或许是抖音2023年必须要做的事之一。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.