一家數據標註公司,估值追上百度和理想汽車

市場資訊
06-25

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

最新估值2000億

作者 | 於米

一提到“數據標註公司”,外界的印象通常是:

技術含量低、工作內容重複枯燥、依賴大量低成本人力完成簡單機械的標註任務,例如給圖片打標籤、文本分類或音頻轉錄。這類公司被視作AI產業鏈底層“苦力”,利潤微薄、附加值低,很難形成核心競爭力或行業話語權。在公衆眼中,它們更多是幕後無名的外包工廠,而非高科技創新企業。

不過,隨着一筆硅谷投資交易浮出水面,你可能要重新構建對數據標註公司的價值評估了。

據多家媒體報道,6月中旬,Facebook母公司Meta出資143億美元(約合人民幣1028億元)獲得數據標註公司Scale AI的49%無投票權股份,將後者的估值一舉推高到了290億美元(約合人民幣2082億元)。

你可能對290億美元的估值沒有概念。截至6月20日收盤,百度理想汽車的市值分別是287.5億美元和263.6億美元。

這是Meta歷史上第二大投資,僅次於2014年以190億美元收購WhatsApp。作爲交易的一部分,Scale AI創始人兼CEO Alexandr Wang在保留原公司董事會成員身份的同時,也將攜部分公司成員加入Meta。

Scale AI創始人 Alexandr Wang 圖源:Scale AI

一石激起千層浪。

得知這一消息後,包括谷歌微軟、OpenAI、馬斯克的xAI等在內多家AI巨頭先後表示計劃撤出與Scale AI的合作。而Scale AI空出的訂單,正被一衆同行瘋搶。

一家數據標註公司何以賣出千億,Meta這次的大動作背後,藏着多少AI巨頭們殘酷爭鬥的暗線?

算力是AI軍備競賽中的關鍵戰略資源。要下場做大模型就得囤顯卡,已然成爲了一個共識。但易爲人忽視的是,訓練數據的質量決定了模型能力的上限,它與囤卡同樣至關重要。

打個比方,如果說大模型是一個勤奮的學生,訓練數據就相當於它的教材。只有給大模型投餵高質量的數據,大模型才能夠給出真實、準確、全面和符合倫理的回答。反之,則會越學越糊塗,無法提供符合預期的輸出。

流傳於業內的一句俗語說,“垃圾進,垃圾出”,說的就是這個道理。在Scaling Laws逐漸失效,靠算力和模型規模硬解的打法陷入瓶頸的當下,提高數據質量有時甚至能起到點石成金的奇效。

以往,數據標註工作主要集中在文本、圖像和音視頻等方面。但現在的數據標註開始變得更爲複雜。隨着行業轉向帶有“思維鏈”的推理模型,專家數據成爲了AI巨頭們眼中的金礦。

OpenAI等AI巨頭轉向推理模型,使專家數據成爲關鍵資源

這也是爲什麼如今的AI標註團隊裏,你不僅能看到完成單調原始工作的合同工和外包人員,有時也會看到不同學科和領域的專業人士。他們會寫下解決複雜問題所需要的思考步驟,輔導大模型模仿人類的思考方式。

Scale AI的商業模式,正是爲客戶提供數據標註解決方案。通過Remotasks和Outlier AI這樣的平臺,他們招募並管理着全球數以十萬計的勞動力。同時,他們也開出不菲的時薪來吸引計算機科學、數學、自然科學、社會科學等專業的博士來撰寫語料。

但若只是如此,Scale AI和市面上其他的數據標註公司並沒有形成差異。

這家公司的真正優勢在於,通過AI輔助的自動化標註能力和成熟的平臺體系,他們能夠高效且靈活地滿足不同客戶的定製化需求,從一家單純的數據標註公司,一躍成爲能夠深度參與數據管理與模型訓練流程的數據基礎設施企業。

Scale AI目前的業務重心是生成式AI所需要的數據 圖源:Scale AI

此前,Scale AI已經贏得了Meta、OpenAI、Google、微軟和美國政府等大金主的訂單。這些頂級客戶不僅爲Scale AI帶來了不菲的收入,也爲之提高了聲譽,給估值的水漲船高提供了背書。

2024年,Scale AI的營收達到8.7億美元,其估值在與Meta的交易之前就來到了140億美元。

Meta拿下Scale AI的49%股份,最顯而易見的收穫當然是後者在數據標註業務上的能力。

有了Scale AI的加持,Meta可以依託前者現有的平臺,建立起一個大型的高質量數據標註網絡,助力自家大模型Llama的開發。

今年4月初,Meta發佈了最新開源大模型Llama 4,可它卻完全沒有了前代產品的驚豔,不但在實測中表現平平,甚至還被爆出了疑似在基準測試中作弊的醜聞。而其旗艦模型Behemoth一再推遲發佈,至今難產。

Llama 4的發佈計劃中包含Behemoth、Maverick和Scout三款模型

如果能夠通過訓練數據質量的提升來改善模型的真實水平,或許可以拯救Meta在開發大模型這一戰線上的頹勢,縮小與OpenAI和Anthropic等對手的身位差距。

不過,光看這一點,可能還無法解釋Meta爲何願意按照Scale AI一年前估值(140億美元)的兩倍來出價,尤其是考慮到從2023年到2024年,Scale AI的營收不過從7.6億美元提高到8.7億美元。

有業內人士猜測,除了搶佔大模型訓練數據這一座山頭之外,Meta對Scale AI的這筆大額投資,其實還有通過Scale AI瞭解對手研發動態的目的。

正如Handshake(Scale AI的競爭對手)的CEO Garrett Lord所說:“如果你是通用汽車或豐田,你不會希望你的競爭對手走進你的製造工廠,看你的流程是如何運轉的。”

雖然Scale AI作爲一家數據標註公司無法接觸到大模型的核心算法,但他們有機會從接觸到的數據和產品模型對客戶的商業戰略和研發重點進行了解。

可能正是出於這樣的擔憂,儘管Scale AI的發言人Joe Osborne在一份聲明中表示“公司將繼續保持獨立”,多家主要客戶(包括谷歌、微軟、OpenAI、馬斯克的xAI等)都決定退出與Scale AI的合作。

Scale AI在其官網列出的部分客戶名單 圖源:Scale AI

這其中,谷歌作爲Scale AI的最大客戶,原本計劃在今年支付2億美元購買人工標註數據。去年Scale AI 8.7億美元的營收中,谷歌一家就貢獻了1.5億美元。

AI巨頭們果斷切割的想法其實很好理解,與Scale AI的合作涉及高度敏感的商業機密,他們不可能放心將這些交給Meta大額持股的公司。

當下,各家數據標註公司還在鯰魚搶食,冀望喫下Scale AI “被分手”以後空出的訂單量。Handshake一夜之間訂單量激增到原來的三倍,Labelbox的CEO則表示,該公司可能會從Scale AI的老客戶那裏獲得數億美元的收入。

Scale AI將如何度過這一波用戶流失潮,目前還不得而知。但這筆交易可能會成爲數據標註行業的轉折點。可以預見的是,AI巨頭們要麼會加大投入去養自家的數據標註團隊,要麼就會將需求分散到多家供應商。

無論哪種模式下,數據標註行業或許將很難再滋養出一家超大公司——AI巨頭們不會允許自己的數據供應鏈被一家獨大的供應商拿捏。

僅從賬面上看,Meta花費如此大的代價投資Scale AI,算不上是一筆好買賣。

Scale AI原本被看好在2025年實現20億美元的營收,但在流失了多家重量級客戶之後,哪怕汽車自動駕駛和政府業務相關的客戶全部留下,要達到這一業績也難度頗高。

而其290億美元的天價估值,也將在對客戶的吸引力下降後冷卻下來。有媒體報道稱,Scale AI的一位早期投資者已經萌生了套現離場的想法。

很難想象Meta會對這樣的業界反應毫無預料,但或許從一開始,Meta就沒有帶着要在財務投資中獲利的心態去做交易。

Meta真正的意圖是什麼?他們想要的不僅是Scale AI,還有Scale AI背後的領路人Alexandr Wang。

Alexandr Wang是AI圈最受關注的年輕企業家之一

類似的“招聘式投資”近些年在硅谷早有先例。

去年,微軟花費6.5億美元,換來AI初創公司Inflection的軟件授權,並聘用了該公司包括老闆Mustafa Suleyman在內的大部分員工。在一筆類似的操作中,谷歌以逾20億美元的估值投資Character.ai,好讓後者團隊中的30人加入Gemini的開發。

對於規模龐大、組織僵化以至於缺乏創新土壤的大公司來說,直接以這種方式引入經過市場驗證的人才,也不失爲一種破局的手段。

Meta確實也十分看重Alexandr Wang的加盟,他們一度想授予這位年輕人“首席AI官”的頭銜。接下來,Meta計劃讓他擔任新部門“超級智能(Superintelligence)”的高級崗位,直接向扎克伯格彙報。

有趣的是,雖然Alexandr Wang即將成爲”超級智能“實驗室的領導者,但他卻並非科班出身的研究人員。

2016年,年僅19歲的Alexandr Wang在用AI攝像頭來監控冰箱庫存的嘗試中,發現了AI數據標註的巨大商機,當年他就從MIT輟學並創立了Scale AI。

在經歷了初期的探索後,這家公司開始專注於與自動駕駛相關的數據標註工作,隨後又開始將業務重心轉向生成式AI。24歲時,Alexandr Wang成爲全世界最年輕的白手起家億萬富翁。

Alexandr Wang也以其過人的社交能力在圈內著稱,OpenAI的CEO Altman就和他關係密切。Scale AI能夠接連從AI巨頭和美國政府手裏接下訂單,與Alexandr Wang強大的人脈也不無關係。

Alexandr Wang出席美國國會聽證會 圖源:Alexandr Wang社媒賬號

此前,據Altman爆料,Meta曾拿出1億美金的簽約獎金到OpenAI撬牆角未果。隨着Alexandr Wang的加盟,Meta不但完成了一次頂級人才的重磅引進,也給後續繼續招兵買馬增加了砝碼。

在對元宇宙的鉅額投資收益慘淡,大模型研發又開始落後於頭部對手的當下,Meta試圖通過“超級智能”彎道超車以奪回AI大戰主動權,也不失爲一次富有魄力的嘗試。

買數據、挖情報、搶人......Meta通過對Scale AI的收購,已經將硅谷的AI大戰帶到了新的高度。不管接下來還有什麼精彩戲碼上演,這場大戰還遠遠沒有迎來拐點。

封面來源丨AI製圖

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10