除了 Gemini 3,全球大模型也迎來集體升級

TradingKey中文
2025/11/27

TradingKey - 本月是ai競爭尤為殘酷的一個月,谷歌的TPU新進展似乎讓市場暫時忘記了AI泡沫。但是,AI大模型不止谷歌gemini3,全球的大模型在本月持續發布了新的版本。

底層架構端:Gemini 3 打破英偉達依賴

目前市場最受矚目的新模型無疑是谷歌的 Gemini 3。它的最大突破在於硬件架構上完全擺脫對英偉達 GPU 的依賴,轉而全面採用谷歌自研的 TPU(Tensor Processing Unit)。

Gemini 3 的升級模式也與以往完全不同。這一次,谷歌並非在現有基礎設施上進行「微調」或「疊代」,而是徹底更換底層架構。

在模型訓練流程上,Gemini 3 的路徑也區別於傳統大模型——如 GPT 系列與 Llama 等通常依賴單一超大 GPU 集羣、海量文本預訓練與有限人類指令微調的方式。谷歌此次引入了全新的 「Mixture-of-Experts(專家協作)」架構:每個任務會自動分配給最匹配的子網絡(專家)處理,從而顯著提高訓練的針對性與計算效率。

從本質上看,Gemini 3 更像是一套結合「基礎學習 + 專業分工 + 實戰演練」的混合體系。憑藉自研 TPU 硬件與分佈式並行算法的結合,谷歌成功將AI模型推向了更貼近真實世界應用的「通用智能」階段,超越了以往大模型嚴格依賴大算力堆疊的訓練套路。

根據第三方機構 Artificial Analysis 的最新綜合評分,Gemini 3 Pro 以顯著優勢排名第一,比 GPT‑5.1 高出 3 分。 這是谷歌自進入語言模型領域以來,首次以絕對優勢登頂全球榜首,也意味着OpenAI長期的領先神話被正式打破。

模型層面:Anthropic 推出 Claude Opus 4.5 強勢突圍

被視為 OpenAI 與 谷歌 最有力競爭對手的 Anthropic,近日發布了旗艦AI模型最新版本—— Claude Opus 4.5。

官方介紹稱,新模型在執行日常任務上的表現 「顯著更強」。尤其在「代理式編程(Agentic Coding)」領域,Claude Opus 4.5 達到行業領先水準。根據軟件能力評測集 SWE‑Bench Verified 的結果,其得分優於 Gemini 3 Pro 與 GPT‑5.1。

與 OpenAI 不同的是,Anthropic 並未投入大量資源開發圖像或視頻生成等重算力領域,而是聚焦於編碼能力優化與企業自動化部署,尤其強調在程序編譯、集成和任務執行等方面的落地實用性,而非人機交互對話功能。目前,該公司已為超過 30 萬家企業用戶提供服務。

在AI編程生態中,Anthropic 已成為不可忽視的力量。上周,微軟英偉達共同宣佈對Anthropic投資數十億美元,公司估值躍升至約 3,500 億美元。合作協議中最受矚目的部分,是微軟 Azure AI Foundry 的客戶可直接訪問 Claude 系列模型——這使 Claude 成為全球唯一同時部署在三大雲平台(Azure、AWS、Google Cloud) 的前沿大模型。

值得一提的是,Anthropic 也在顯著擴大 TPU 的使用。根據報道,公司簽署了一項價值數十億美元的長期雲合作協議,未來將使用高達「一百萬顆 TPU」,總價值或達「數百億美元」。這不僅反映出其與谷歌的算力合作關係,也說明外部前沿AI開發者已普遍認可谷歌TPU的性能與成本優勢。

根據 Menlo Ventures 7月發布的報告,Anthropic 在企業級 AI 採用率中位居第一,佔 32% 市場份額;OpenAI 以 25% 居次(較兩年前幾乎腰斬),谷歌 20%,Meta 9%。

應用端:OpenAI GPT‑5.1 強化生態佈局

長期以來,OpenAI 一直穩居行業「最聰明模型」的頭銜。其願景是創造造福全人類的通用人工智能(AGI),並以「大而全」的戰略路線鞏固行業主導:產品組合更豐富、組織體系更龐大。

11 月 22 日,OpenAI 正式發布GPT‑5.1。資深AI使用者普遍認為,該版本較前代「明顯更智能」。

為迎接假日購物季需求高峯,OpenAI 還於本周一推出免費AI購物搜索功能,試圖讓聊天模型融入消費者購物流程,從而打造新的商業化場景。

官方博客指出,該功能基於GPT‑5‑Thinking‑Mini 模型優化,通過問答方式收集用戶偏好,再在網絡中逐步推薦 10 至 15 件商品供篩選。

過去幾周,OpenAI 密集更新產品:包括羣組聊天功能、面向美國 K‑12 教師的免費版 ChatGPT,以及內置 ChatGPT 的瀏覽器版本。這顯示公司正在積極拓展用戶規模與使用場景,以應對增長壓力並強化平台生態。

中國 LLM:阿里 Qwen 3 Max 同樣出色

中國AI陣營同樣迎來突破。11 月 24 日,阿里巴巴 布新一代人工智能交易模型 Qwen 3 Max(通義千問 3 Max)。

產品公開測試僅一周,下載量突破 1,000 萬次,刷新全球AI應用歷史記錄。短短時間內,Qwen 3 Max 在增長速度上超越 ChatGPT、Sora 乃至今年早些時候引發轟動的 DeepSeek,成為史上增速最快的AI產品。

性能方面,Qwen 3 Max‑Preview 在多個權威評測集(MMLU、GSM8K、HumanEval、BIG‑Bench Hard 等)中均刷新通義系列最佳紀錄,在部分項目上甚至超越 GPT‑5 與 Claude Opus 4。

受益於其AI雲業務的大幅上漲,阿里巴巴雖然在其主營電商業務上表現不算特別出色,市場仍然對這幾公司基於了很高的想象空間。

從投資與金融交易維度看,中國AI模型也展現強勁實力。 在 Hyperliquid 交易平台 組織的「Alpha Arena」實盤實驗中,每個AI模型均獲 1 萬美元資金、在同等條件下自主交易加密貨幣永續合約。 結果顯示:DeepSeek 以 57.5% 收益率拔得頭籌,而Qwen 3 Max 以 25% 收益率位列第二,累計執行 36 筆交易,夏普比率 0.328,為所有參賽模型中表現最穩定者。

Qwen 3 Max 在策略層面專注于波動性控制與風險均衡,有效避免大型模型常見的「過度交易」與「風險飆升」問題,顯示出卓越的穩定性與策略優化能力。

原文鏈接

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10