炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
(來源:智東西)

智東西
編譯 程茜
編輯 雲鵬
智東西10月21日報道,今天,據The Information援引知情人士報道,OpenAI的日本競對Sakana AI被曝將以25億美元(摺合人民幣約178億元)估值籌集1億美元(摺合人民幣約7億元),相比去年9月的15億美元(摺合人民幣約107億元)估值增長66%。
知情人士透露,Sakana AI正在與美國和日本投資者進行談判,籌集這筆1億美元新資金後,Sakana AI的估值將達到26億美元(摺合人民幣約185億元),該公司計劃利用新資金擴大其工程、銷售和分銷的員工團隊,它現在有大約70名員工。
Sakana AI成立於2023年7月,其創始團隊來頭不小。David Ha是前谷歌大腦高級科學家,還曾領導圖像生成模型獨角獸Stability AI的研究部門,另一位創始人Llion Jones是Transformer論文作者之一、前谷歌AI研究員。今年8月,David Ha還登上了《時代》發佈的2025年百大AI人物排行榜。

這家創企與OpenAI、Anthropic等企業所選擇的路線不同,其希望拋棄Transformer架構,以自然進化為靈感降低模型計算成本並提升模型性能。在產品進展方面,該公司已經發布三款日語模型、江戶古風聊天機器人Karamaru以及開源框架ShinkaEvolve。
目前,Sakana AI共計拿下了將近2.3億美元(摺合人民幣約16億元)孖展。2024年1月,Sakana AI獲得45億日元(摺合人民幣約2億元)孖展,Lux Capital、Khosla Ventures、日本電信公司NTT以及索尼集團參投;去年9月,Sakana AI完成2.14億美元(摺合人民幣約15億元)A輪孖展,英偉達參投成為大股東,使其成立一年估值達到約15億美元(摺合人民幣約107億元),迅速躍升為獨角獸。
此外,據The Information報道,該公司還獲得了日本政府的撥款,用於購買AI訓練的計算資源。
Sakana AI在日語中意為魚,Ha此前告訴The Information,他打算建立一個「日本的DeepMind」。
Ha透露,其算法可以幫助企業自動創建處理語言或圖像的大模型,實現方法是在組合、測試和丟棄數據時模仿自然選擇的規律,從而減少所需的人工輸入量。這是因為訓練大模型所需的電力或資源量消耗巨大的,他希望將這段時間縮短到幾天或幾周。
具體來看,Sakana AI採用的算法是將三種開源原始AI模型作為「父母」,通過不同方式「養育」超百名」子女」,接着選出表現最優的模型,然後再生成下一代,然後不斷重複這一過程,創造出數百代模型後選出佼佼者。
今年3月,SakanaAI發佈三款日語模型,分別是大語言模型EvoLLM-JP、視覺語言模型EvoVLM-JP和圖像生成模型EvoSDXL-JP。
時隔一月,Sakana AI發佈江戶古風聊天機器人Karamaru,這個聊天機器人可以用江戶時代的世界觀和當時的古代文獻來回答用戶,其訓練數據來自該公司從江戶時代書籍中建立的包含約2500萬個字符的數據集。
今年9月,Sakana AI開源了ShinkaEvolve,該框架將大模型與一種算法相結合,幫助其針對各種潛在問題提出解決方案,並縮小到最相近的問題。該公司聲稱,與Transformer架構相比,這種方法更高效,更能提出創造性的解決方案。

截至目前,Sakana AI已經與多個日本大公司簽訂業務協議。
今年5月,它宣佈與三菱日聯金融集團建立多年合作伙伴關係,為日本最大的銀行開發定製AI模型。這筆交易達成後,Ha告訴外媒,這將使Sakana AI在一年內實現盈利;本月早些時候,Sakana AI宣佈與日本最大的券商之一大和證券集團建立類似的合作伙伴關係。
Ha提到,日本每家想要擁有自己的基礎模式的公司都可以與Sakana AI或其他像Sakana AI這樣的公司合作開發自己的模式,日本還有成為創新者的空間。
此外,在日本,Sakana AI還面臨諸多美國大模型開發商的競爭。
今年2月,OpenAI宣佈與軟銀建立合作伙伴關係,軟銀同意每年為自己及其子公司花費30億美元(摺合人民幣約214億元)購買OpenAI的技術,軟銀和OpenAI還將成立一家合資企業,專門向日本公司銷售OpenAI工具套件;Anthropic在今年8月任命了日本國家負責人,並準備在日本東京開設辦事處;今年8月,加拿大大模型創企Cohere聘請了一名日本國家經理。
結語:Sakana AI押注日本本土大模型
Sakana AI與法國大模型創企Mistral AI、印度大模型創企Krutrim類似,其希望通過開發自己的大模型並讓模型更好掌握自己地區的語言和文化,以減少對其他AI技術的依賴。Ha認為,對於日本的公司來說,可以選擇擁有自己的基礎模型是有意義的,即使它不是一個超高性能的模型。
但相比於OpenAI、Anthropic、谷歌等大模型核心玩家,Sakana AI這類創企在資金、人才實力上都相對較弱,其需要通過算法等的創新找到突破路徑。