ClickHouse挑戰Snowflake,蹭上AI東風 | 企服國際觀察

鈦媒體
2025/07/14

上月,開源列式數據庫廠商ClickHouse宣佈完成3.5億美元C輪孖展,該輪孖展後值達到63.5億美元,幾乎翻了三倍,引發了業內一輪不小震動。

不光在於孖展與估值高低,還在於ClickHouse所在的賽道——AI時代的大數據分析和存儲,該領域的客戶需求正日益高漲,同時對數據庫的要求也在全面升級。

ClickHouse作為一款開源列式數據庫,在處理該類數據時表現出的顯著優勢,不僅力壓同類型的列式數據庫,也讓雲數倉獨角獸Snowflake,以及老牌大廠產品Redshift、BigQuery等有了一絲緊張之感。

ClickHouse脫胎於俄羅斯第一大搜索引擎Yandex的開源項目,於2021年正式獨立為商業化公司。如今,ClickHouse發展勢頭正盛,通過向客戶收取雲託管費用,其業務在過去一年增長超過300%,服務企業客戶超過2000家,覆蓋金融科技、交通、消費者和醫療保健等多個行業。最近的一些客戶包括AI初創公司Anthropic、特斯拉,以及阿根廷最大電商Mercado Libre等。另據外媒可參考消息,ClickHouse在第一季度末時的年經常性收入已達到7000萬美元,年化營收運行率接近1億美元。

ClickHouse越來越成為一家不可忽視的數據庫廠商。不過,對於ClickHouse的發展勢頭,首先會存在一個疑問:為什麼是此時?以及ClickHouse的市場前景如何?

技術即是成本護城河

相對於行存儲的傳統關係型數據庫,列式數據庫意味着數據保存在類似電子表格的行、列中,這種列式架構可顯著加快分析型任務的速度。在數據處理過程中,數據庫系統需要同時從多個存儲區域檢索數據,而數據訪問速度會顯著受到存儲位置的影響——從相鄰區域讀取數據的速度要遠快於從分散區域讀取。

ClickHouse從設計之初就充分利用了這一特性來優化查詢性能。它將同一列的數據儘可能存儲在相鄰的物理區域,這種存儲佈局使得列數據能夠被連續讀取,大幅減少了尋址時間,從而顯著提升掃描效率。這種設計特別適合分析型查詢場景,因為這類查詢通常需要快速訪問大量列數據。

筆者此前與數據庫專家交流獲得一個觀點是,數據驅動的分析應用越來越普遍,要求數據庫技術棧實現統一架構。在此之前,這些技術棧彼此獨立,如MySQL+Teradata+Elastic Search等多個系統搭積木的模式,這個架構最大的問題在於過於複雜,需要搭建一個集羣來完成數據分析的能力,搭建與維護成本較高。

具體而言,如開源的MySQL,這類事務型數據庫面向OLTP場景設計,社區研發方向側重於加強其事務處理的能力,一般無法擴展以應對處理大量、複雜查詢所需要的分析型任務。傳統數倉針雖內部批量處理密集型用例進行了優化,但併發性有限且性能較慢。而類似於Elastic Search的傳統搜索引擎技術,對於非結構化數據分析而言成本高昂,包括存儲和計算資源的佔用增加,以及無法實現快速精準檢索等因素,限制了其實際應用範圍。

ClickHouse提供了一個專門的解決方案來彌補差距——將高性能分析與當今智能數據驅動應用所需的可擴展性和併發性相結合。作為高性能列式存儲,ClickHouse能夠以極低的延遲在海量數據集上執行交互式分析查詢,非常適合於支持AI和機器學習應用,以及實時分析、可觀測性等任務。

蹭上AI東風

除了技術架構的創新,ClickHouse的發展也離不開市場與客戶需求的變化。由於企業不再只是構建BI或批量報告,而是希望搭建一個實時的智能數據平台,並且同時為人類和AI Agent所調取。結合當前AI Agent的設計思路,由於生成查詢的速度遠超人類,面向其設計的數據平台/數據庫必須具備低延遲響應、支持交互式分析查詢的能力,同時還要有更高的吞吐量,以滿足其高效處理數據的要求。

以近期大熱的AI編程為例。儘管多數AI編程助手推出時間不長,但開發者留存率依然較高。據研究公司Indagari數據顯示,至少72%訂閱了編程助手Cursor的用戶在六個月後仍繼續付費;超過20%的用戶訂閱了多個編程助手,且這一比例還在不斷增長。高留存率反映的是AI編程的強粘性,這也意味着企業應用開發速度正借AI之勢迎來快速增長。

AI需要能夠快速釋放數據價值的數據基礎設施,這件事情已變得緊迫。

近期,ClickHouse分享了Anthropic應用其數據庫解決方案的經歷。Anthropic團隊技術人員給了ClickHouse非常高的評價:「ClickHouse在幫助我們開發和發布Claude 4方面發揮了重要作用。」據其所述,訓練高級模型需要持續了解性能指標和系統行為,ClickHouse在實時分析數據的速度和靈活性非常高。

對於Anthropic而言,有三點核心訴求:一是實時採集海量數據,對半結構化數據進行快速、多維度分析;二是部署安全;三是可擴展性,能與市面上的可觀測性工具實現良好兼容。但ClickHouse的開源版本並不能完全滿足其上述需求,為此Anthropic選擇在內部部署了隔離的ClickHouse Cloud雲產品。從控制平台到數據平台,實現內部隔離。

Anthropic在探索智能分析Agent(agentic analytics)領域,通過引入ClickHouse的MCP服務器,Anthropic可以將其模型(例如AI編程工具Claude Code)直接連接到ClickHouse。這意味着,Agent可以通過編程方式查詢指標、詢問、檢索答案,而無需編寫傳統的查詢語言。

一些投資人士指出,在AI興起、市場對數據庫軟件需求高漲的當下,ClickHouse可能會與Snowflake競爭,比方說ClickHouse的實時分析能力會優於Snowflake。雖然有些客戶想要Snowflake提供的「花哨功能」,但ClickHouse速度更快,更便宜,且專注於實時分析。

業內將ClickHouse與Snowflake、Redshift、BigQuery反覆拿來對比的一個核心因素,還在於成本。

一些人士認為,ClickHouse能夠以25%-40%的成本提供相同或更優的性能,基本可以取代Snowflake和BigQuery。比如Snowflake在計算方面往往相對昂貴,而BigQuery的按需查詢模型在處理大量數據掃描時可能會變得昂貴。早在2023年,ClickHouse就曾公開發表言論稱,Snowflake等雲數倉產品在滿足客戶需求和性價比上存在的挑戰。

如今,ClickHouse同樣將市場目光放到了Agent領域。據ClickHouse首席執行官Aaron Katz的描述,隨着Agent在數據驅動型應用、可觀測、數據基礎設施等領域的蓬勃發展,像ClickHouse這類面向Agent的數據庫需求已經達到一個轉折點。分析的未來不僅僅是報表,而是能夠解讀數據、出發工作流並支持實時決策Agent。

一些投資人士認為,隨着開發人員轉向Agent,即Agent可以通過客戶瀏覽器或企業應用執行復雜任務,ClickHouse將迎來更高的需求。

這點也成為風投追捧ClickHouse作為下一個Snowflake繼任者的關鍵點。畢竟,在數據庫領域,能夠快速發展的初創型軟件公司,不多了。

三位創始人:CEO Aaron Katz;CTO Alexey Milovidov;產品 Yury Izrailevsky

回顧ClickHouse的發展,該公司始於俄羅斯科技巨頭Yandex的內部需求。2009年,為了高效處理Yandex.Metrica搜索引擎的海量數據分析任務,Yandex團隊開始研發一款高性能列式數據庫,這便是ClickHouse的雛形。經過多年內部優化,2016年Yandex將其開源,憑藉卓越的查詢速度和對大規模數據分析的天然優勢,ClickHouse迅速在開發者社區走紅,成為OLAP領域的明星項目。

隨着開源生態的壯大,ClickHouse的核心團隊在2021年從Yandex獨立,並獲得了硅谷風投的青睞。公司成立後,團隊在保持開源版本活力的同時,開始推進商業化,於2022年推出ClickHouse Cloud託管服務,並完成數輪孖展,估值一度飆升至20億美元。

在獲得該輪孖展後,ClickHouse步伐明顯加快,除了推動大客戶市場打開,最新任命了在Atlassian、Slack等頭部SaaS軟件企業的銷售老兵Kevin Egan為首席營收官,還同步收購了HyperDX、PeerDB等初創公司。(本文首發於鈦媒體APP,作者 | 楊麗,編輯 | 蓋虹達)

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10