
「我最近剛滿19歲,從大學計算機專業退學創業,致力於創建高質量的代碼數據,為AI大模型提供支持。」
這句話出自Serena Ge,一位華人面孔的00後女孩。現在,她是AI數據公司Datacurve的聯合創始人兼CEO——公司成立僅一年,卻已拿下1770萬美元孖展(約合人民幣1.26億元)。
悄然間,一場屬於00後的AI創業潮正在席捲全球。
19歲女生,大學創業
AI「賣鏟人」
2006年,Serena Ge出生於中國,後來隨父母到加拿大生活,很早的時候就萌生創業的念頭。
高中時,因熱愛攀巖,她研發出一款個性化訓練的攀巖App,頗受攀巖愛好者好評。此後,她還帶領一支23名高中生組成的團隊,共同開發一款面向青少年的效率類網頁應用,項目獲得加拿大道明銀行支持。
2022年,她考入加拿大滑鐵盧大學,就讀計算機專業。然而,Serena很快發現校園主流氛圍是「畢業後找份體面的穩定工作」,這與她渴望投身前沿科技、親手創造未來的衝動格格不入。
轉折出現在2024年。當時憑藉AI智能體項目UncleGPT,她收到了創業孵化器Y Combinator的邀請,幾乎毫不猶豫,便毅然選擇輟學。也是這一年,Serena與同為亞裔的校友Charley Lee,共同創立AI數據公司Datacurve。
這次創業緣起於她曾在AI大模型獨角獸Cohere實習經歷,擔任機器學習工程師。期間她發現同行很難獲得專家級的標註數據——受限於成本等原因,AI標註公司不會招聘高素質的軟件工程師來做最基礎的數據標註工作。
「大模型之所以存在瓶頸,就是因為缺乏豐富的、精心挑選的高質量標註數據。」Serena稱這正是Datacurve想要破解的數據難題。
與依賴龐大的外包團隊的Scale AI不同,Datacurve的數據收集模式頗為有趣,以「賞金獵人」系統吸引熟練的軟件工程師完成最難的數據獲取部分。
簡單來看,在Datacurve的「賞金平台」Shipd上,超過1400名程序員來應對算法、測試、UI/UX流程等任務挑戰,每解決一個任務,用戶可獲得5到50美元不等的費用。這種激勵機制旨在獎勵質量和速度,截至目前公司已發放超過100萬美元賞金。
「這是一款面向用戶的產品,而不是單純的數據標註工作,」Serena表示,工程師參與其中的最大動力並非金錢。實際上,數據標註的報酬永遠低於軟件開發等服務。因此公司的核心競爭力在於提供良好的用戶體驗,並讓更多高質量的程序員加入其中。
公司表示,隨着大語言模型不斷演進,人工智能不再只需要簡單的數據標註,而是大量的訓練數據和評估數據。公司通過遊戲化平台提高數據生成及標記的精準度,進而完成高質量的數據交付。
目前該團隊只有約10人左右,還在招聘中。公司表示成立兩個月時收入就超過了100萬美元,如今已為超過一半的基礎模型實驗室以及Facebook、蘋果、亞馬遜、谷歌等公司提供高質量的代碼數據,助力訓練下一代更先進的大語言模型。
啱啱孖展1個億
直至最新孖展,Datacurve闖入了創投圈視野。
近日,公司完成一筆1500萬美元的A輪孖展,由風投機構Chemistry VC領投,其他投資者還有Y Combinator、Afore Capital、Homebrew等機構,以及來自 DeepMind、OpenAI、Anthropic、Vercel和 Coinbase等公司的投資人參與。
「這是我們投資過增長最快的初創公司之一。就在上周,Datacurve啱啱簽署了迄今為止最大的合同。」Chemistry合夥人Mark Goldberg回憶第一次見到Serena的情景,對她的勤奮記憶猶新。
更早之前,公司完成了270萬美元的種子輪孖展,由Y Combinator、Y Combinator、Afore Capital、Pioneer Fund等機構支持,Coinbase前首席技術官Balaji Srinivasan參與了投資。
至此,短短一年時間,這個00後創始人團隊累計孖展1770萬美元,約合人民幣1.26億元。
AI界有一個著名的梗:「有多少人工就有多少智能。」數據標註公司大多擁有龐大的外包團隊來提煉數據,也被戲稱為「賽博富士康」。但某種程度上,數據標註公司們專注於AI最剛性的環節:無論技術如何演進,模型訓練始終離不開「乾淨」的數據,這正是數據標註不可替代的根本原因。
發展至今,數據、算法和算力,是AI的三大基石。如果說英偉達是算力的賣鏟人,那麼數據標註公司便是數據的賣鏟人。
相比之下,她的競爭對手更為人熟知——Scale AI。今年6月,Meta斥資約150億美元入股,Scale AI估值一舉超過290億美元。
這裏不得不提到同樣是華裔的Edwin Chen,他所創辦的Surge AI正在進行10億美元首輪孖展,對應估值升至約240億美元(約合1712億元人民幣)。而他因持有公司約75%的股份,身家達到180億美元,首次登上《福布斯》美國富豪榜,成為今年最年輕的億萬富翁。
「這僅僅是開始。我們將利用這筆資金,加速基礎模型的發展——通過為大語言模型提供前沿訓練數據,推動AI能力的邊界。」Serena稱堅信AI的進步,不僅受算力限制,更受數據質量與複雜度的制約。
AI江湖,00後殺瘋了
不知不覺,00後創業孖展上億已不再是傳奇,幾乎每天都在上演。
就在上周,Axiom Math正式完成首輪6400萬美元(約合人民幣4.6億元)孖展,由B Capital領投,Greycroft、Madrona和Menlo Ventures等機構參與,投後估值3億美元(約合人民幣20億元)。
締造Axiom的正是00後洪樂潼(Carina Hong)——在廣州出生長大,她曾就讀於著名的華南師大附中,多次拿下奧數競賽獎牌。後考入麻省理工學院,碩士畢業於牛津大學,又來到斯坦福大學攻讀博士學位。
不久前,兩位來自麻省理工的00後——22歲的華裔女生Jessica Wu和23歲的尼爾·德什穆克,所創立的Sola Solutions拿下硅谷知名風投的孖展。官網顯示,孖展包括由Conviction領投的350萬美元種子輪,以及由a16z領投、Conviction跟投的1750萬美元A輪,總計2100萬美元(約合人民幣1.5億元)。
還有AI標註公司Mercor,正在尋求約百億美元的估值。此前公司已完成兩輪孖展,B輪後估值約為20億美元。公司創始人是三位退休的00後。大二那年,三人在宿舍裏創立Mercor,後來決定從哈佛及喬治敦大學退學全職創業。
類似的故事,也在國內上演。
今年初,三個來自清華的「00後極客」——閔宇恒、程頤、李宜哲創業做機器人,零次方誕生。如今公司一舉完成天使+和天使++輪億元級孖展,集結河創投、同創偉業、力合科創、水木基金、瑞穗力合、拉爾夫創投等知名機構。
我們看到,還有靈初智能的聯合創始人陳源培、UniX AI創始人兼CEO楊豐瑜、重隼科技創始人蔣正豪……越來越多年輕面孔不斷湧現。
時不我待。「AI不等人,晚一步,就真的錯過了風口。」這些創始人大多從小就開始編寫代碼,他們認為人工智能是千載難逢的機會。有人放棄名校學位輟學創業,甚至有人放棄考大學就帶着夢想,殺入了AI賽道。
這羣年輕人身上,疊加着許多令人驚歎的標籤:天才、輟學、勤奮、極客、一人公司……20歲的獨角獸公司CEO不再稀奇,帶領數十人乃至上百人團隊的00後比比皆是。正如一位硅谷投資人所說:「如今19歲創業,都不算早。」他們夜裏鍛鍊健身,白天寫代碼,中午談孖展,晚上上線Demo——這是Z世代創業者的日常。他們以驚人的速度,正重塑AI的未來。
真格基金合夥人劉元曾指出:「AI讓創業門檻被重新定義。技術讓所有人站在同一條起跑線上,而這一代年輕人最大優勢是——沒有包袱,學習快,動手更快。」
後浪奔湧,這是屬於這一代人的時代機遇。