炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
最新估值2000亿
作者 | 于米
一提到“数据标注公司”,外界的印象通常是:
技术含量低、工作内容重复枯燥、依赖大量低成本人力完成简单机械的标注任务,例如给图片打标签、文本分类或音频转录。这类公司被视作AI产业链底层“苦力”,利润微薄、附加值低,很难形成核心竞争力或行业话语权。在公众眼中,它们更多是幕后无名的外包工厂,而非高科技创新企业。
不过,随着一笔硅谷投资交易浮出水面,你可能要重新构建对数据标注公司的价值评估了。
据多家媒体报道,6月中旬,Facebook母公司Meta出资143亿美元(约合人民币1028亿元)获得数据标注公司Scale AI的49%无投票权股份,将后者的估值一举推高到了290亿美元(约合人民币2082亿元)。
你可能对290亿美元的估值没有概念。截至6月20日收盘,百度和理想汽车的市值分别是287.5亿美元和263.6亿美元。
这是Meta历史上第二大投资,仅次于2014年以190亿美元收购WhatsApp。作为交易的一部分,Scale AI创始人兼CEO Alexandr Wang在保留原公司董事会成员身份的同时,也将携部分公司成员加入Meta。
一石激起千层浪。
得知这一消息后,包括谷歌、微软、OpenAI、马斯克的xAI等在内多家AI巨头先后表示计划撤出与Scale AI的合作。而Scale AI空出的订单,正被一众同行疯抢。
一家数据标注公司何以卖出千亿,Meta这次的大动作背后,藏着多少AI巨头们残酷争斗的暗线?
算力是AI军备竞赛中的关键战略资源。要下场做大模型就得囤显卡,已然成为了一个共识。但易为人忽视的是,训练数据的质量决定了模型能力的上限,它与囤卡同样至关重要。
打个比方,如果说大模型是一个勤奋的学生,训练数据就相当于它的教材。只有给大模型投喂高质量的数据,大模型才能够给出真实、准确、全面和符合伦理的回答。反之,则会越学越糊涂,无法提供符合预期的输出。
流传于业内的一句俗语说,“垃圾进,垃圾出”,说的就是这个道理。在Scaling Laws逐渐失效,靠算力和模型规模硬解的打法陷入瓶颈的当下,提高数据质量有时甚至能起到点石成金的奇效。
以往,数据标注工作主要集中在文本、图像和音视频等方面。但现在的数据标注开始变得更为复杂。随着行业转向带有“思维链”的推理模型,专家数据成为了AI巨头们眼中的金矿。
OpenAI等AI巨头转向推理模型,使专家数据成为关键资源
这也是为什么如今的AI标注团队里,你不仅能看到完成单调原始工作的合同工和外包人员,有时也会看到不同学科和领域的专业人士。他们会写下解决复杂问题所需要的思考步骤,辅导大模型模仿人类的思考方式。
Scale AI的商业模式,正是为客户提供数据标注解决方案。通过Remotasks和Outlier AI这样的平台,他们招募并管理着全球数以十万计的劳动力。同时,他们也开出不菲的时薪来吸引计算机科学、数学、自然科学、社会科学等专业的博士来撰写语料。
但若只是如此,Scale AI和市面上其他的数据标注公司并没有形成差异。
这家公司的真正优势在于,通过AI辅助的自动化标注能力和成熟的平台体系,他们能够高效且灵活地满足不同客户的定制化需求,从一家单纯的数据标注公司,一跃成为能够深度参与数据管理与模型训练流程的数据基础设施企业。
此前,Scale AI已经赢得了Meta、OpenAI、Google、微软和美国政府等大金主的订单。这些顶级客户不仅为Scale AI带来了不菲的收入,也为之提高了声誉,给估值的水涨船高提供了背书。
2024年,Scale AI的营收达到8.7亿美元,其估值在与Meta的交易之前就来到了140亿美元。
Meta拿下Scale AI的49%股份,最显而易见的收获当然是后者在数据标注业务上的能力。
有了Scale AI的加持,Meta可以依托前者现有的平台,建立起一个大型的高质量数据标注网络,助力自家大模型Llama的开发。
今年4月初,Meta发布了最新开源大模型Llama 4,可它却完全没有了前代产品的惊艳,不但在实测中表现平平,甚至还被爆出了疑似在基准测试中作弊的丑闻。而其旗舰模型Behemoth一再推迟发布,至今难产。
Llama 4的发布计划中包含Behemoth、Maverick和Scout三款模型
如果能够通过训练数据质量的提升来改善模型的真实水平,或许可以拯救Meta在开发大模型这一战线上的颓势,缩小与OpenAI和Anthropic等对手的身位差距。
不过,光看这一点,可能还无法解释Meta为何愿意按照Scale AI一年前估值(140亿美元)的两倍来出价,尤其是考虑到从2023年到2024年,Scale AI的营收不过从7.6亿美元提高到8.7亿美元。
有业内人士猜测,除了抢占大模型训练数据这一座山头之外,Meta对Scale AI的这笔大额投资,其实还有通过Scale AI了解对手研发动态的目的。
正如Handshake(Scale AI的竞争对手)的CEO Garrett Lord所说:“如果你是通用汽车或丰田,你不会希望你的竞争对手走进你的制造工厂,看你的流程是如何运转的。”
虽然Scale AI作为一家数据标注公司无法接触到大模型的核心算法,但他们有机会从接触到的数据和产品模型对客户的商业战略和研发重点进行了解。
可能正是出于这样的担忧,尽管Scale AI的发言人Joe Osborne在一份声明中表示“公司将继续保持独立”,多家主要客户(包括谷歌、微软、OpenAI、马斯克的xAI等)都决定退出与Scale AI的合作。
这其中,谷歌作为Scale AI的最大客户,原本计划在今年支付2亿美元购买人工标注数据。去年Scale AI 8.7亿美元的营收中,谷歌一家就贡献了1.5亿美元。
AI巨头们果断切割的想法其实很好理解,与Scale AI的合作涉及高度敏感的商业机密,他们不可能放心将这些交给Meta大额持股的公司。
当下,各家数据标注公司还在鲶鱼抢食,冀望吃下Scale AI “被分手”以后空出的订单量。Handshake一夜之间订单量激增到原来的三倍,Labelbox的CEO则表示,该公司可能会从Scale AI的老客户那里获得数亿美元的收入。
Scale AI将如何度过这一波用户流失潮,目前还不得而知。但这笔交易可能会成为数据标注行业的转折点。可以预见的是,AI巨头们要么会加大投入去养自家的数据标注团队,要么就会将需求分散到多家供应商。
无论哪种模式下,数据标注行业或许将很难再滋养出一家超大公司——AI巨头们不会允许自己的数据供应链被一家独大的供应商拿捏。
仅从账面上看,Meta花费如此大的代价投资Scale AI,算不上是一笔好买卖。
Scale AI原本被看好在2025年实现20亿美元的营收,但在流失了多家重量级客户之后,哪怕汽车自动驾驶和政府业务相关的客户全部留下,要达到这一业绩也难度颇高。
而其290亿美元的天价估值,也将在对客户的吸引力下降后冷却下来。有媒体报道称,Scale AI的一位早期投资者已经萌生了套现离场的想法。
很难想象Meta会对这样的业界反应毫无预料,但或许从一开始,Meta就没有带着要在财务投资中获利的心态去做交易。
Meta真正的意图是什么?他们想要的不仅是Scale AI,还有Scale AI背后的领路人Alexandr Wang。
Alexandr Wang是AI圈最受关注的年轻企业家之一
类似的“招聘式投资”近些年在硅谷早有先例。
去年,微软花费6.5亿美元,换来AI初创公司Inflection的软件授权,并聘用了该公司包括老板Mustafa Suleyman在内的大部分员工。在一笔类似的操作中,谷歌以逾20亿美元的估值投资Character.ai,好让后者团队中的30人加入Gemini的开发。
对于规模庞大、组织僵化以至于缺乏创新土壤的大公司来说,直接以这种方式引入经过市场验证的人才,也不失为一种破局的手段。
Meta确实也十分看重Alexandr Wang的加盟,他们一度想授予这位年轻人“首席AI官”的头衔。接下来,Meta计划让他担任新部门“超级智能(Superintelligence)”的高级岗位,直接向扎克伯格汇报。
有趣的是,虽然Alexandr Wang即将成为”超级智能“实验室的领导者,但他却并非科班出身的研究人员。
2016年,年仅19岁的Alexandr Wang在用AI摄像头来监控冰箱库存的尝试中,发现了AI数据标注的巨大商机,当年他就从MIT辍学并创立了Scale AI。
在经历了初期的探索后,这家公司开始专注于与自动驾驶相关的数据标注工作,随后又开始将业务重心转向生成式AI。24岁时,Alexandr Wang成为全世界最年轻的白手起家亿万富翁。
Alexandr Wang也以其过人的社交能力在圈内著称,OpenAI的CEO Altman就和他关系密切。Scale AI能够接连从AI巨头和美国政府手里接下订单,与Alexandr Wang强大的人脉也不无关系。
此前,据Altman爆料,Meta曾拿出1亿美金的签约奖金到OpenAI撬墙角未果。随着Alexandr Wang的加盟,Meta不但完成了一次顶级人才的重磅引进,也给后续继续招兵买马增加了砝码。
在对元宇宙的巨额投资收益惨淡,大模型研发又开始落后于头部对手的当下,Meta试图通过“超级智能”弯道超车以夺回AI大战主动权,也不失为一次富有魄力的尝试。
买数据、挖情报、抢人......Meta通过对Scale AI的收购,已经将硅谷的AI大战带到了新的高度。不管接下来还有什么精彩戏码上演,这场大战还远远没有迎来拐点。
封面来源丨AI制图
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.