為什麼垂直AI應用正在改寫遊戲規則

你是否也相信，OpenAI 那一萬億美元的估值意味着通用 AI 會吞噬整個經濟？如果你這麼想，那可能需要重新審視一下了。最近讀到 Nikhil Davar 和 Byrne Hobart 的一篇深度分析，徹底改變了我對 AI 應用競爭格局的看法。他們提出了一個極具顛覆性的觀點：真正能夠捕獲巨大經濟價值的，可能不是那些試圖成為"萬能路由器"的通用 AI 平台，而是那些深耕在特定垂直領域、位於經濟活動邊緣的專業化 AI 應用。

而他們用來證明這個觀點的案例更是讓人震驚：OpenEvidence，一家醫療領域的 AI 公司，最近以 120 億美元的估值完成孖展，比去年 10 月的 60 億美元估值翻了一倍。更驚人的是，他們的廣告收入年化已經達到 1.5 億美元，並且以每月 30% 的速度增長，毛利率高達 90%。一家成立不到幾年的公司，已經聚合了美國 50% 以上的醫生，每天使用時長平均 14 分鐘。上一次有技術產品被醫生群體如此快速採用，還是 Google 出現的時候。

這個案例讓我開始深入思考一個問題：在 AI 時代，通用平台和垂直應用之間的競爭格局，到底會如何演變？為什麼一個專注醫療領域的 AI 應用，能夠在 OpenAI、Anthropic 和 Google 這些巨頭的包圍下，不僅生存下來，還能建立起幾乎不可撼動的護城河？

Router 的本質是什麼

Davar 和 Hobart 在幾個月前提出了一個非常有意思的概念框架，叫做"Routers, Apps, AGI"。他們的核心觀點是：AI chatbot（聊天機器人）的真正價值，不在於它能回答多少問題，而在於它能把查詢路由到任何可以回答這些問題的工具上——可能是另一個模型，可能是第三方服務，可能是服務提供商的結賬頁面，也可能是需要僱佣的顧問的聯繫方式。本質上，這是一個 Hayekian（哈耶克式）的願景：最大的問題是通用的信息傳輸。

我對這個觀點的理解是：每當世界上任何地方發生變化，都會以不可預測的方式改變人們的最優行為。你需要某種系統將這些信息傳遞給目標接收者，同時不會用瑣碎信息淹沒他們。價格機制是一種優雅的解決方案，但按需智能可以在更多維度上運作。換句話說，AGI（通用人工智能）不是數據中心裏的諾貝爾獎得主，而是一種超人類的協調技術，代表着經濟本身的某種高保真模擬。

想象一下，如果我們都戴着 Google Glasses，或者更進一步，擁有某種腦機接口，那麼 Google 獨家訪問這些高保真的實時傳感器，就能通過組織世界上所有高熵信息來協調大量經濟活動，而且是在信息創建的那一刻就開始組織。OpenAI 大約一萬億美元的估值，就是在押注 OpenAI 能夠在更大的經濟份額上應用這種路由過程，或者比任何其他公司更精確地做到這一點。

但我認為這個願景有一個關鍵假設：通用 router（路由器）能夠獲得足夠的傳感器數據，並且能夠建立足夠的信任，讓用戶願意通過它來完成各種任務。而 Davar 和 Hobart 的文章恰恰指出了這個假設的問題所在：有太多經濟上有價值但難以識別的"暗物質"，是中心化的大型實驗室看不到的。而那些更專注的垂直應用，已經在看到這些經濟上有價值的問題，並且會在相當長一段時間內繼續這樣做。

OpenEvidence 如何建立不可複製的護城河

OpenEvidence 的案例之所以引人入勝，是因為它清晰地展示了垂直 edge router（邊緣路由器）如何在巨頭的夾縫中不僅生存，還能茁壯成長。他們的策略可以總結為三個詞：信任、獨家性和複合效應。

醫生可能是世界上最看重資格認證的群體之一，部分原因是他們整個成年早期都在賺取一個人為稀缺的資格。一個技術取代資格、取代人類專業知識的可識別信號、取代專家機構的世界，會讓醫生感到非常不舒服。Davar 和 Hobart 提到了一個很生動的建議：下次你去看醫生時，問問他們關於你在 Google 或 ChatGPT 上找到的某些健康建議，觀察他們的面部表情和反應。我自己也試過類似的情況，醫生的反應通常是介於懷疑和不屑之間。

OpenEvidence 深刻理解了這一點，並實施了一套完整的可信度策略。他們明確地與那些在開放互聯網上訓練的實驗室進行對比定位。那些實驗室的訓練數據包括健康博客、社交媒體等等——任何用"醫生討厭這個奇怪技巧"來營銷的療法都會出現在廣泛的訓練數據集中。OpenEvidence 則訓練了一套專門的模型集合，完全基於 3500 萬份同行評審的來源，最初是從 FDA、CDC、PubMed 等公共領域材料開始的。他們的模型在訓練或推理期間與公共互聯網完全沒有連接。

這意味着他們早期系統的幻覺風險明顯低於 o1 之前的推理範式 LLM，而且產品是免費的，所以醫生開始病毒式地採用它。這裏有一個非常聰明的地方：那些早期採用者中，恰好有一些人是最負盛名的醫學期刊編輯委員會的高級成員。這導致了下一個關鍵環節：OpenEvidence 能夠鎖定與 JAMA、NEJM、NCCN、美國醫學會、所有 11 種 JAMA 專科期刊、美國家庭醫師學會、美國急診醫師學院等的獨家內容合作伙伴關係。

這裏有一個特別有意思的細節。OpenEvidence 的 CEO Daniel Nadler 提供了一些背景信息：一些資金雄厚的 AI 公司向 NEJM 投入了大量資金，但他們拒絕了。如果 NEJM 是一傢俬營公司，他們可能會同意，但他們是非營利組織，所以他們拒絕了，因為馬薩諸塞州醫學會作為非營利組織，更關心作為非營利組織使命的神聖性和純潔性，而不是只想獲得某種快速商業合同。事實上，是 NEJM 主動聯繫 OpenEvidence，而不是相反："在我們的案例中，我們沒有出現在他們門口。新英格蘭醫學雜誌編輯委員會中有很多高級人物是 OpenEvidence 的重度用戶，他們希望他們的內容出現在他們正在使用的東西中。"

我認為這個案例揭示了一個深刻的洞察：在某些垂直領域，資格認證和信任不僅僅是營銷手段，它們是產品本身的核心組成部分。通用 AI 平台無法複製這一點，因為它們的價值主張本質上是通用性和便利性，而不是在特定領域的深度專業性和可信度。

Dark Matter 的概念：無法被發現只能被創造的價值

Davar 和 Hobart 文章中最讓我震撼的部分，是關於"dark matter"（暗物質）的討論。這不是物理學上的暗物質，而是指那些在經濟上極具價值但難以識別的上下文信息。OpenEvidence 所創造的暗物質，是醫生基於高熵、特殊患者情況的臨床不確定性。

這裏有一個關鍵的認知轉變：這種暗物質不是被發現的，而是被創造的。它之所以被創造，完全是因為信任的存在。中心化路由器無法通過提供更優越的通用智能來複制這一點，因為醫生不會為他們不信任的平台生成上下文。你可以將醫生向 OpenEvidence 詢問或透露的內容集合，建模為他們非常猶豫向 ChatGPT 詢問的確切內容集合：缺乏信任會創造極高的驗證成本，而不驗證不受信任的輸出帶來的不對稱下行風險，意味着有價值的上下文根本不會被生成。

我對這一點的理解是：這完全顛覆了關於上下文和 AI 的常見假設。默認的心智模型是一種發現模型：有價值的信息存在於世界上某個地方，傳感器的工作就是去找到它，抓取它，然後將其傳回路由器。但 OpenEvidence 的服務更接近於銷售對知情猜測的確認，加上支持它的文檔。

醫生的思維軌跡——將關於患者症狀、診斷結果、病史的實時數據流以及他們所有先前的知識和直覺歸結為臨床假設，特別是他們對假設的懷疑（"臨床不確定性"）——此前在任何其他系統中都不存在，無論是本地、雲端、紙上，哪裏都沒有。也許當醫生向另一個他們信任的醫生詢問特定患者場景的建議時，它作為電波存在過。沒有人能夠大規模實時地調查醫生的診斷不確定性；最好的醫生不會填寫調查問卷，即使他們填了，填寫調查問卷的行為在質量上也不同於從真實、新穎患者案例的持續流中，在真實的壓力和不確定性下透露的上下文。

Mercor、Surge 和 Scale 這些公司正在試圖為大型實驗室複製這一點，但質量不一樣，大量的體面輸入也無法彌補最佳輸入的質量：那些僱佣醫生為通用 AI 工具提供和評價答案的公司，僱佣的是那些沒有通過使用專用 AI 工具賺大錢的醫生，而且可能會受到負面選擇。這很難改變，因為存在貨幣的時間價值。Mercor、Surge、Scale 等公司付錢讓你訓練一個模型，而該訓練的輸出在未來某個時間點會有價值。患者或保險公司今天就在為醫生的輸出付費，而這些輸出對他們來說（至少在理論上）今天就極具價值。

這個洞察讓我重新思考了 AI 應用的競爭優勢來源。不是誰擁有更大的模型，不是誰擁有更多的計算資源，而是誰能夠創造出一個環境，讓用戶願意在其中透露他們最有價值的思考和不確定性。這種價值創造是關係性的，是交互性的，無法通過簡單的數據抓取或模型升級來複制。

垂直 Edge Router 的五個價值維度

Davar 和 Hobart 提出了一個非常有用的框架來理解 router 的價值。他們認為，router 的價值超越了原始智能，是以下幾個因素的某種乘法函數：解決問題的絕對人數、這些人的經濟價值、為他們解決的問題的相對經濟價值、用戶浮現的解決問題所需信息的比例，以及你能夠多完整地解決這些問題。

OpenEvidence 在所有這五個維度上都極具優勢。他們為醫生解決問題（美國收入最高的專業人士），而且為很多醫生解決：截至上個月，美國 50% 以上的醫生，即 60 萬人，正在使用 OpenEvidence，平均每天使用 14 分鐘。他們解決的是醫生面臨的經濟價值最高的問題：臨床決策，也就是在不確定性和實時情況下對患者的實際診斷和治療。而且他們是迄今為止最完整的解決方案：基於最負盛名的醫學期刊的證據，在 USMLE（美國醫師執照考試）上得分 100%，幫助醫生將患者匹配到可能挽救生命的臨床試驗，建議最有可能解決患者問題並幫助醫生完成工作的上下文感知治療路徑、藥物、醫療設備等等。

我特別欣賞這個框架的地方在於，它強調了"完整性"的重要性。很多 AI 應用只是提供信息或建議，但無法真正執行或完成任務。OpenEvidence 則在不斷擴展它的"actuator"（執行器）能力。他們今天的主要執行器是提供廣告（將醫生的注意力路由到製藥公司），但臨床試驗匹配是一個完全不同的、更有價值的執行器（將患者路由到試驗）。下一個邏輯執行器可能是事前授權自動化（路由付款），很難看到這會在哪裏停止：每個新執行器都擴展了 OpenEvidence 可以訪問和執行的解決方案集合，同時對中心化路由器保持上下文的暗化。

這讓我想到，AI 應用的真正護城河可能不在於 AI 技術本身，而在於它能夠建立的完整價值鏈。從信息到建議，從建議到執行，從執行到結果驗證，每一步都在深化與用戶的關係，創造更多的暗物質，吸引更多的解決方案提供商。這是一個自我強化的飛輪，而通用 AI 平台很難在所有垂直領域同時建立這樣的飛輪。

為什麼通用 AI 無法贏者通喫

這篇文章給我最大的啓發，是它挑戰了"通用 AI 將贏者通喫"的主流敘事。OpenAI、Anthropic 和 Google 都推出了醫療保健產品，那麼為什麼 OpenEvidence 還能有持久性？答案歸結為複合信任以及這種信任所帶來的能力。

文章中提到了一個深刻的認識論失敗模式，我覺得值得深入思考。大型實驗室的整個智能理論都預設：更多數據和更多計算在所有領域產生更有能力、經濟上更有價值的系統。他們的商業模式、資本支出策略和投資者敘事都迫切希望這是真的。OpenEvidence 的成功是一個非常好的反例：它使用在少得多的數據上訓練的專門模型創造了巨大的經濟價值。大型實驗室不容易承認，在最具經濟價值的領域之一，正確類型的較少數據優於每種類型的更多數據。

在某種程度上，承認這一點會質疑他們的整個策略，或者至少表明他們可能在問錯誤的問題。這也意味着，與其從更好的模型中獲得一次大勝利，不如在所有有足夠訓練數據產生專門模型的 N 個主題上獲得 N 次大勝利，其中沒有一個完全值得成為頭條新聞。在這一點上，他們的業務更接近 Bloomberg 或 FactSet 的業務：收集和清理數據仍然有很多收入（和利潤！），但它不像通用智能產品那樣擴展。

我認為這個觀察非常深刻。它暗示了 AI 的未來可能不是一個統一的通用智能平台統治一切，而是無數個垂直專業化的 AI 應用，每個都在自己的領域建立深度護城河。這些應用的總價值可能遠遠超過任何單一通用平台的價值，因為它們能夠更深入地滲透到經濟活動的各個角落，創造和捕獲那些通用平台無法觸及的暗物質。

飛輪效應：信任如何創造不可複製的優勢

OpenEvidence 的成功可以概括為一個強大的飛輪：獨家的 credentialed ground truth（有資格認證的基礎真相）使傳感器值得信任 → 信任使潛在暗物質變得可識別（50% 以上的美國醫生每天透露他們的臨床不確定性，因為他們信任傳感器）→ 可識別的暗物質在不泄露給中心化路由器的情況下私下貨幣化（製藥公司為訪問醫生最高意圖時刻支付 70-150 美元的 CPM）→ 越來越多的解決方案，從臨床試驗患者招募到事前授權再到醫療設備發現等，不斷接入，並複合暗物質的生成和捕獲。

隨着越來越多的邊緣/領域特定問題被識別並通過越來越大的解決方案賬本準確、完整地解決，一個新的信號被創建並複合：領域中經過驗證的結果。這些經過驗證的結果（某些匹配解決某些問題的效果如何）可以通過強化學習來改進邊緣路由器。這是一個失控的優勢，如果沒有前面的步驟以及讓這個過程成熟所需的時間，是很難複製的。

我特別想強調的是時間維度的重要性。這不是那種可以通過投入更多資源快速複製的優勢。信任需要時間建立，獨家合作關係需要時間積累，用戶行為數據需要時間沉澱，結果驗證需要時間觀察。即使 OpenAI 明天決定全力進軍醫療領域，他們也無法在短期內獲得 NEJM 的獨家合作，無法讓醫生群體立即信任他們，無法快速積累 60 萬醫生每天 14 分鐘使用時長所產生的暗物質。

這讓我想到了投資中的複利概念。OpenEvidence 每天都在複利他們的優勢：更多的使用產生更多的數據，更多的數據吸引更多的合作伙伴，更多的合作伙伴提供更好的解決方案，更好的解決方案吸引更多的用戶。這個飛輪一旦轉起來，就會產生巨大的動能，很難被打破。

臨床試驗匹配：Actuator 擴展的典型案例

文章中提到的一個具體例子特別能說明問題：OpenEvidence 啱啱推出了臨床試驗匹配和患者招募功能。製藥公司目前每年向 CRO（臨床研究組織）支付數十億美元來招募患者進行臨床試驗並運行這些試驗，非常緩慢且低效。如果 OpenEvidence 能夠比 CRO 更快地填充三期試驗，並且匹配更好的患者，製藥公司將受益匪淺。招募期越快，試驗開始得越快，患者越好，試驗成功的可能性就越高。

一個更快、成功可能性更高的試驗意味着藥物在專利保護下獲得壟斷利潤的時間更長。具體來說，平均製藥公司目前每年僅在患者招募上就花費約 20 億美元（每位患者約 4 萬美元），80% 的試驗延遲。每延遲一天，根據藥物不同，損失的收入在 60 萬到 800 萬美元之間。對於重磅藥物（如 GLP、Keytruda 等），專利保護下的單日價值約為 800 萬美元。製藥公司願意支付遠高於 70-150 美元 CPM 的價格來加速這一過程。

這個例子讓我深刻理解了 actuator（執行器）擴展的概念。OpenEvidence 今天的主要執行器是提供廣告，但臨床試驗匹配是一個完全不同的、更有價值的執行器。下一個邏輯執行器可能是事前授權自動化，很難看到這會在哪裏停止。每個新執行器都擴展了 OpenEvidence 可以訪問和執行的解決方案集合，同時對中心化路由器保持上下文的暗化。

我認為這揭示了垂直 AI 應用的一個關鍵優勢：它們可以沿着價值鏈自然擴展，因為它們深度嵌入在特定的行業生態系統中。通用 AI 平台可能能夠在表面層面提供類似的功能，但無法像垂直應用那樣深入到行業的核心流程和決策環節中。

中間遊戲：Edge Router 的時代

Davar 和 Hobart 使用了"middle game"（中間遊戲）這個術語來描述當前的狀態。從理論上講，隨着時間的推移，實驗室和中心化的經濟世界模型應該能夠獲得一切，但存在一箇中間遊戲，非常值得深入考慮——特別是因為遊戲規則正在逐漸揭示。

我對這個"中間遊戲"的理解是：我們正處在一個過渡期，通用 AI 的願景尚未完全實現，但垂直 AI 應用已經在創造實實在在的價值。這個過渡期可能會持續很長時間，長到足以讓那些在垂直領域建立了強大護城河的公司，成長為難以撼動的巨頭。

文章的結尾部分提出了一個一般化的論點，我覺得非常有說服力：無論哪裏存在兩個（或更多）經濟上有價值但難以識別的上下文池，而中心化路由器無法橋接（或不被信任橋接），邊緣路由器都有機會創建受信任的傳感器，生成並捕獲暗物質，並使其對願意付費的市場參與者可識別。

這個框架可以應用到很多其他垂直領域。法律領域有沒有類似的暗物質？金融領域呢？教育領域呢？製造業呢？我認為答案是肯定的。在每個這樣的領域，都存在着只有深度嵌入該領域的專業化 AI 應用才能捕獲的價值。

我的反思：通用與專業的辯證法

讀完這篇文章，我對 AI 應用的競爭格局有了全新的認識。過去我傾向於相信"通用 AI 將統治一切"的敘事，但現在我意識到這可能過於簡化了。現實可能更接近於一個多層次的生態系統：通用 AI 平台提供基礎能力，但真正的價值捕獲發生在垂直應用層。

OpenEvidence 的案例讓我特別深刻地意識到，在某些領域，信任和專業性不是可以通過更強大的技術能力來彌補的東西。醫生不會僅僅因為 ChatGPT 更聰明就開始向它透露他們的臨床不確定性。同樣，律師不會僅僅因為通用 AI 能夠理解法律文本就開始依賴它來做關鍵決策。在這些高風險、高專業性的領域，建立信任需要的不僅是技術能力，還需要領域專業性、合規性、與行業標準和實踐的深度整合。

我也開始思考這對創業者意味着什麼。如果你正在構建 AI 應用，也許不應該試圖成為下一個 OpenAI，而應該找到一個足夠大、足夠有價值的垂直領域，在那裏建立深度護城河。關鍵是找到那些存在大量"暗物質"的領域——那些有價值但難以被通用平台捕獲的上下文信息。

從投資角度看，這也改變了我對 AI 公司估值的看法。OpenEvidence 120 億美元的估值，在傳統軟件公司的標準下可能顯得過高，但如果你理解了他們所建立的飛輪效應和護城河的深度，這個估值就開始顯得合理了。他們不僅僅是一個軟件工具，而是醫療決策生態系統中的一個關鍵節點，能夠創造和捕獲其他任何人都無法觸及的價值。

最後，我想說的是，這篇文章最有價值的地方，不是它預測了未來會發生什麼，而是它提供了一個清晰的框架來思考 AI 應用的競爭優勢來源。無論你是創業者、投資者還是從業者，理解"edge router"的概念、"dark matter"的本質、以及信任和專業性在某些垂直領域的不可替代性，都會幫助你在這個快速演變的領域中做出更好的判斷。

AI 的未來可能不是一個贏家通喫的遊戲，而是一個既有通用平台又有無數垂直應用的生態系統。在這個生態系統中，真正的價值捕獲可能發生在那些能夠在特定領域建立深度信任、持續創造和捕獲暗物質、並不斷擴展其執行器能力的垂直應用身上。這是一個令人興奮的時代，因為它意味着機會不僅僅屬於那些資源最雄厚的科技巨頭，也屬於那些能夠深刻理解特定領域需求、建立真正信任關係的專業化團隊。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

為什麼垂直AI應用正在改寫遊戲規則

熱議股票