GPT-5不及预期,但给OpenAI喂数据的公司却身价暴涨

市场资讯
Aug 11

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:虎嗅APP)

出品|虎嗅科技组

作者|SnowyM

编辑|陈伊凡

头图|视觉中国

“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第“12”篇文章。

8月8日,OpenAI最新模型GPT-5正式发布,但性能提升幅度远没有达到人们期待的“下一代模型”水准,虽然性能有一部分大幅提升,但有相当一部分并未与o3或者是Claude、Grok4拉开距离。

这个现象背后,整个AI行业正在面临一个关键转折点:仅仅通过增加数据量和计算资源来提升模型性能的传统路径,可能已接近天花板。

此时,一家给OpenAI喂数据的公司浮出水面——Turing。

2022年年初,Turing的CEO——乔纳森·西达尔特(Jonathan Siddharth)从美国硅谷帕洛阿尔托,驱车前往OpenAI的办公室。彼时的Turing是一家人力资源招聘公司。

在去的路上,他做好了给这家新兴的硅谷AI巨头推销Turing产品的准备——Turing可以帮助OpenAI招聘人才。

当走进办公室时,一堆OpenAI的研究员却向乔纳森提了一个需求——他们不要人,他们要数据。彼时,OpenAI的研究员们发现,在训练GPT-3的数据集中,加入一些计算机代码,有助于提高模型的推理能力。因此,他们希望Turning能够给他们提供质量上乘的代码,用于GPT-4的开发中。

这次会议,成为了Turing发展的拐点。只用了7年时间,这家公司从零达到22亿美元估值,并且成为了继Scale AI之后,硅谷第二家风头正盛的数据标注公司。

如今随着大模型能力的演进,互联网上可公开的数据已经很少了,对更难生成的数据的需求将会急剧增长。随着Scale AI被Meta收购,Turing将有希望在数据标注领域成为估值第一的公司。

虎嗅接触了Turing的早期投资方——硅谷风投资机构UpHonest Capital,其投资人表示,他们对Turing团队的第一印象是沉稳从容的连续创业团队,对产品路线与商业化有清晰判断;同时,Turing还通过高频、透明的进展汇报营造出强烈的FOMO(形容创业者对新技术、新趋势敏感的表现),善于动员资源。

彼时的Turing与现在的业务相距甚远,UpHonest Capital投资Turing是2019年,正值Zoom上市,Zoom早期借助了亚洲工程人才红利快速成长,投资方认为,这是“人才地理套利”结构性机会,而Turing创始团队具备亚裔跨境背景与执行力,在这一赛道拥有天然优势。这也是他们投资Turing的原因。

不过,业内投资人也表示,Turing这样的数据标注公司,本质上还是一种人力资源外包型企业,毛利率不高,需要精细化运作和控制成本。随着如今数据标注公司越来越多,数据的质量成为了竞争的胜负手。

Turing正在书写着"经济上行期"的故事。

Turing最初切入的是远程工程师招聘市场,凭借AI驱动的人才云(Talent cloud,Turing积攒的人才网络)平台快速壮大。

2021年,公司成功跻身独角兽行列。此时,他们已经有了400万专业开发者的庞大人才网络和ALAN AI平台(Turing自研的AI模型开发工具平台),并成为了最大、最国际化的开放人才平台之一。

但这远不是故事的结局。

当OpenAI等顶级AI基础模型厂商对数据的需求正在疯涨时,Turing捕捉到这一机遇,果断转型为AGI基础设施提供商,将以往积攒的庞大资源(软件工程代码数据及模型评估能力)包装成标准化服务。

如今,头部模型厂商基本都是Turing的客户,例如,OpenAI、Anthropic、Google、Meta等顶级AI实验室,Turing为他们提供模型训练、微调和智能体开发等底层支持。

如果了解大语言模型的诞生经过就知道,大模型会先将大量从网页上收集到的数据进行预训练,然后再经过微调和后训练,让AI模型学习如何回答问题,在监督微调中,模型可以通过专门的数据,学会新的技能。这个专门的数据,就是Turing提供的,标注过的,高质量数据集。

这个目的是让模型学习和泛化。因此,数据标注的专业性在这个环节就显得尤为重要。

Turing的人才库中,有涉及不同领域的专家。乔纳森表示,他们要做的就是提供互联网上搜不到的数据。

资本市场对Turing的认可度可以用“估值翻倍”来概括。2021年底的Series D轮融资中,公司筹得8700万美元,投后估值约11亿美元,正式成为独角兽。

2025年3月完成的Series E轮融资:1.11亿美元的资金注入让估值直接翻倍至22亿美元。这轮融资由马来西亚主权财富基金Khazanah Nasional Berhad领投,WestBridge Capital、Sozo Ventures、UpHonest Capital等十多家机构参投。

截至Series E完成,Turing累计融资总额约2.25亿美元。更值得关注的是其业绩表现:2024年公司年度收入达到3亿美元规模,较上一年增长三倍,并成功实现盈亏平衡。

我们梳理了Turing的融资历史:

最新财务数据显示,Turing的 年度经常性收入(ARR)约3亿美元。

Turing由Jonathan Siddharth和Vijay Krishnan于2018年联合创立。

Vijay Krishnan(左)Jonathan Siddharth(右)

两位创始人均拥有斯坦福大学计算机科学硕士背景,在校期间因对机器学习的共同兴趣而结识,并萌生了联合创业的想法 。研究生毕业后,他们多次合作技术项目并尝试创业。

2008年,他们联合创办了内容推荐平台Rover,后于2016年被Revcontent收购 ,两人深刻体会到仅依赖湾区本地招募顶尖工程师的局限,于是开始尝试远程分布式团队的模式 。

在这个过程中,他们逐步摸索出如何高效甄别和管理全球各地的人才,并“无心插柳”地获得了打造AI驱动的人才云平台的灵感。

2018年,Jonathan和Vijay将这一洞见付诸实践,创立了Turing,以机器学习技术对工程师进行技能审核和匹配,帮助企业“云端组建”全球开发者团队。

正如Jonathan所强调的,传统线下招聘和外包模式已难以满足高速发展的科技行业需求,他们希望通过Turing打造全球人才网络,让企业“不受地理位置限制找到世界上最优秀的人才”。

Turing的华丽转身值得细说,因为他们所上演的故事几乎堪称传统企业向AI企业转型的标准教科书。

在收到OpenAI需求时,乔纳森坦言,他们当时完全没料到ChatGPT会引发AI热潮,更没想到“软件工程师的代码对教会大语言模型思考和推理如此重要”。“他们的要求简直是疯了,他们想要在这么短的时间内获得大量数据。”乔纳森回忆。

但最后,Turing确实给OpenAI在模型性能上提供了巨大帮助,使得ChatGPT能够在发布后,震惊世界。

另一面,Turing并没有完全抛弃原有业务。创始人强调,各条业务线都在增长,只是把主要资源投入到AI相关的新业务上。这种务实的做法为新战略提供了现金流支撑。

Turing的AI业务

转型后的Turing形成了两大核心业务板块,即公司内部称为“Turing AGI Advancement”和“Turing Intelligence”的两条业务线。

Turing AGI Advancement专门服务全球顶级AI实验室,帮助提升前沿基础模型的各项能力。简单说,就是让AI模型变得更聪明。他们为OpenAI、Anthropic、Google、Meta等顶尖公司提供高质量训练数据、代码生成、模型微调等服务。

Turing Intelligence则致力于将前沿AI能力转化为企业应用。面向财富500强企业和政府机构,构建定制的AI系统和解决方案,帮助传统企业实现智能化升级。

两条产品线分别对应"造模型引擎"与"用模型赋能",既服务AI行业本身,又将AI能力推广到各行各业。

支撑业务发展的是Turing的两大核心资产,这两大资产又能够形成闭环,为Turing提供源源不断的专业数据资产。

Turing的AI+人才循环

首先是AI驱动的人才云平台。Turing声称通过自动化测试筛选,Turing从全球数百万报名者中筛选出400万技术人才,堪称全球最大的人类智能网络之一。当AI项目需要特定专家时,平台能迅速匹配合适团队。

例如,当OpenAI需要大量Python/C++工程师编写代码来丰富模型训练数据集时,Turing可以迅速组建起一支分布式的专业开发者团队投入任务 ;又如某制药企业需要生命科学背景的标注人员来给模型做专业数据标记,Turing也能从人才库中筛选出合格的PhD等高端人选。

其次是自研的ALAN AI工具平台,用于高效编排AI模型开发的各类工作流。ALAN将人类专家与机器算法紧密结合,支持从数据生成到模型评估的全流程自动化。Turing通过这个平台实现了模型训练与优化的"流水线式"标准化生产。

Turing最初采用典型的人力资源外包模式,通过撮合企业与远程开发者并抽取佣金盈利。

转型后,商业模式变得更加多元:

在Turing AGI Advancement板块,公司的主要客户是全球顶级的AI模型研发机构。这些AI Labs利用Turing来获取大规模的定制数据服务和人类反馈,例如为模型生成代码语料、构建评测基准、执行模型对比测试,以及提供成百上千名有特定领域专业的标注人员进行RLHF微调等 。

Turing Intelligence板块,则类似软件项目制或订阅制,从需求分析到部署运维,提供端到端的AI应用开发服务。在多个行业已有显著成果,例如帮助医院降低15%库存成本、将制药晶体分析时间从250小时缩短到2-3小时、提升银行客服响应速度40%

2024年,Turing实现了盈利,这也证明了商业模式的可持续性。投资者也给予高度评价,从Foundation Capital、WestBridge到马来西亚主权基金,每轮融资都有顶级机构背书。

根据市场研究机构预测,全球AI数据收集与标注市场2024年的规模已达到约180亿美元,预计2025年将增至约220亿美元,此后几年维持20–30%的年复合增长率 。

这一领域受到资本的热烈追捧:Scale AI等头部公司的高估值就是明证。例如Meta斥资143亿美元收购Scale AI 49%股权,将该数据标注独角兽估值推高至290亿美元,并挖走其CEO负责Meta的超级智能项目 。

OpenAI的内部评估亦印证了这种趋势——其表示,下一代模型若按传统方式训练,性能增益将大幅低于预期,GPT-5就是最好的例子 。为突破瓶颈,各大实验室纷纷寻求解决方案,包括从企业自身业务中挖掘私有数据、生成合成数据、引入更多人类反馈等。

去年12月,OpenAI展示了一项叫做"Test-Time Scaling"的新技术测试结果,这被业界视为大模型在后预训练时代提升能力的重要突破。这个技术简单来说,就是让AI在回答问题时花更多时间"思考",从而给出更准确的答案。

2024年下半年,OpenAI秘密开发了一个代号为"Orion"的新模型。公司内部原本计划将它作为万众瞩目的GPT-5发布,期望它能比当时最强的GPT-4o模型表现更出色。然而,测试结果让人失望——Orion的表现并没有达到预期的大幅提升。

从Orion到GPT-4.5再到GPT-5,海外媒体的许多报道印证了一个事实:性能提升确实不够显著。这期间,关于OpenAI面临数据瓶颈的消息不断传出。特别值得注意的是,OpenAI前首席科学家Ilya Sutskever在一次公开演讲中曾表示,支持Scaling Law(算力越大越好)的高质量训练数据已经不多了。

一个显而易见的趋势是,数据标注正在进入“精英喂养”时代,各领域的专家,取代了初级数据标注员。

其中,引入海量高质量人类标注和代码数据被证明是近期最有效的手段之一 。例如,Meta在训练Llama3模型时投入了超过1000万条人类标注数据 。但如此巨量且高质量的数据获取绝非易事,必须建立起专业化的数据生产流水线。

这正是像Turing这样的AI数据服务商崛起的背景:它们填补了AI实验室“数据生产能力”的空白,帮助后者源源不断地获取所需的“燃料”,从而延续Scaling Law。

乔纳森在Turing官网上发布了一篇文章提出,领先的前沿实验室正在面临新的挑战——需要具有适当深度、多样性和反馈结构的数据,从而真正释放能力提升——这意味着,数据标注领域,正在进入“精英喂养”的模式。乔纳森则表示,Turing采取的是中立的态度,不会与任何实验室对抗。

Surge AI的创始人Edwin Chen表示,质量高于一切。Turing则能够提供400多万软件工程师、数据科学家、领域专家的人才库;能够即时招聘跨专业领域的博士、奥林匹克级别的人才;发起人工智能驱动的审查,确保每位贡献者的质量一致。

不过,随着资本不断涌入,这个赛道正变得越来越拥挤。数据质量是决定这个行业的胜负手,并且,当大语言模型的性能提升曲线逐渐平缓,对数据标注的质量要求将越来越高。

在AI数据服务领域,Turing和SurgeAI这两家十分有潜力的AI公司走出了截然不同的路子,就像两个基因不同的物种,各有各的生存策略。

硅谷三大数据标注公司情况 虎嗅根据公开信息整理

Turing更像一个什么都能干的“一站式平台”。由于一开始的人才云业务积累,它的业务范围很宽,既能提供技术人员(工程师、数据科学家),又能提供高质量的代码数据和评测,并依靠这些能力帮助企业搭建AI系统。

而Surge AI走的是精品路线,主要做多轮对话标注、AI安全测试、复杂评测等高难度任务,需要顶级专家和严格流程来保证质量。业内提到它的融资时,都会强调"人类在环"这个定位。其创始人Edwin Chen在谈及SurgeAI业务时,十分“骄傲”,并始终强调“质量为王”。

它的扩张逻辑与Turing完全不同:不求量大,但求价值高。围绕高质量数据这个核心,不断完善工具和流程,让每个数据样本都更值钱。

在AI数据提供这方面,SurgeAI虽然晚成立2年,但已经围绕数据深入做好了相关技术储备,甚至被称为“业内早已公认超越了ScaleAI”,而Turing的资源池积累相对更大一些,未来的Turing还有多大上升空间,值得关注。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4673897.html?f=wyxwapp

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10