智通財經APP獲悉,中信建投發布研報稱,Mythos是Anthropic迄今最強模型,能力出現躍遷式增強,代碼、推理與研究輔助全面領先前代。其在真實網絡安全場景中優勢最突出,不僅在 Firefox 漏洞利用任務中遠超 Opus 4.6,還可發現並利用零日漏洞。此外,Mythos 在生化研發及金融、AI訓練、機器人等行業研發流程中也具備明顯加速作用。Anthropic背後由亞馬遜、谷歌投資與算力供給,並在近期加強合作,2027年起TPU需求量達到3.5GW,谷歌TPU產業鏈有望持續受益於前沿模型訓練需求擴張。
中信建投主要觀點如下:
1. 迄今最強模型,能力出現躍遷式增強。Claude Mythos 被 Anthropic 定義為「迄今最強大 AI 模型」,能力曲線出現了明顯躍遷。其在軟件工程、推理、知識工作和研究輔助等多個維度明顯強於 Opus 4.6。以代碼能力為例,Mythos 在 SWE-bench Verified 上達到 93.9%,顯著高於 Opus 4.6 的 80.8%;價格方面,其 API 定價達到 25 美元/百萬輸入token和 125 美元/百萬輸出token,約為 Opus 4.6 的 5 倍。
2. Cyber(指一個模型或系統在執行與網絡空間相關的任務時所展現的技術水平)能力極強,尤其在真實場景中出現斷層式領先。Mythos在更貼近真實世界的 Firefox 漏洞利用任務中,總成功率達到 84.0%,其中完整漏洞利用成功率達到 72.4%,遠高於 Opus 4.6 的 15.2% 。同時,Mythos 還能在真實系統中發現並利用零日漏洞,典型案例是挖出存在 27 年的 OpenBSD 漏洞,說明其 cyber 能力已從「會做安全題」躍遷到「能在真實環境中找洞並利用漏洞」。
3.在生化研發與多行業研發流程中均具備明顯放大作用。除 cyber 外,Mythos 在化學、生物及更廣泛研發場景中的價值也開始清晰顯現。在生化領域,其對公開文獻、實驗流程、多步驟 protocol 和生物序列設計/功能預測的整合能力明顯增強;在更廣泛產業端,其在 Kernel task、LLM training等任務上也明顯強於前代,部分任務已達到數小時到 40 小時級別人類工時等價,有望加速生物醫藥、金融量化、AI 基礎設施、機器人和自動駕駛等多個行業的研發流程升級。
4.對齊能力當前最好,但低頻出錯的風險更大。Mythos 是其迄今「總體最對齊」的模型。經過後訓練後,模型在破壞性行為、作弊式行為以及對人類濫用請求的配合率上均較前代繼續下降。但由於其能力上限提升過快,極少數情況下若沿錯誤軌道繼續執行,隱蔽完成額外目標、規避監控的能力也更強。
5. Anthropic:孖展與算力合作同步加碼,谷歌與亞馬遜是核心合作伙伴。Anthropic 截至 2026 年 4 月估值已達 3800 億美元,ARR 超過 300 億美元。亞馬遜累計投資 80 億美元,並通過 AWS 與 Trainium 深度綁定 Anthropic 核心訓練;谷歌累計投資30多億美元,自2025年10月份開始合作,2026年4月,Anthropic進一步增加明年TPU的部署量,未來預計達3.5GW,按照功耗推算,預計達200-300萬顆芯片採購。
6. 谷歌 TPU:微架構與集群系統雙重迭代,有望持續受益前沿模型訓練需求擴張。谷歌 TPU 的核心優勢,不只是單芯片性能提升,而是「芯片 + 互聯 + 集群」一體化演進。從 TPUv1 到 TPUv7,谷歌持續在矩陣計算單元、HBM、ICI 互聯、拓撲結構和集群能力上升級,使 TPU 從早期推理芯片逐步發展為可支撐超大模型訓練的完整超級計算平台。隨着谷歌與頭部AI公司在下一代TPU 集群上的合作不斷加深,TPU 正在成為前沿模型訓練的重要底座。
風險提示:人工智能技術發展不及預期;互聯網廠商資本開支不及預期;參與廠商衆多導致競爭格局惡化;政策監管力度不及預期。