除了 Gemini 3,全球大模型也迎来集体升级

TradingKey中文
Nov 27, 2025

TradingKey - 本月是ai竞争尤为残酷的一个月,谷歌的TPU新进展似乎让市场暂时忘记了AI泡沫。但是,AI大模型不止谷歌gemini3,全球的大模型在本月持续发布了新的版本。

底层架构端:Gemini 3 打破英伟达依赖

目前市场最受瞩目的新模型无疑是谷歌的 Gemini 3。它的最大突破在于硬件架构上完全摆脱对英伟达 GPU 的依赖,转而全面采用谷歌自研的 TPU(Tensor Processing Unit)。

Gemini 3 的升级模式也与以往完全不同。这一次,谷歌并非在现有基础设施上进行“微调”或“叠代”,而是彻底更换底层架构。

在模型训练流程上,Gemini 3 的路径也区别于传统大模型——如 GPT 系列与 Llama 等通常依赖单一超大 GPU 集群、海量文本预训练与有限人类指令微调的方式。谷歌此次引入了全新的 “Mixture-of-Experts(专家协作)”架构:每个任务会自动分配给最匹配的子网络(专家)处理,从而显著提高训练的针对性与计算效率。

从本质上看,Gemini 3 更像是一套结合“基础学习 + 专业分工 + 实战演练”的混合体系。凭借自研 TPU 硬件与分布式并行算法的结合,谷歌成功将AI模型推向了更贴近真实世界应用的“通用智能”阶段,超越了以往大模型严格依赖大算力堆叠的训练套路。

根据第三方机构 Artificial Analysis 的最新综合评分,Gemini 3 Pro 以显著优势排名第一,比 GPT‑5.1 高出 3 分。 这是谷歌自进入语言模型领域以来,首次以绝对优势登顶全球榜首,也意味着OpenAI长期的领先神话被正式打破。

模型层面:Anthropic 推出 Claude Opus 4.5 强势突围

被视为 OpenAI 与 谷歌 最有力竞争对手的 Anthropic,近日发布了旗舰AI模型最新版本—— Claude Opus 4.5。

官方介绍称,新模型在执行日常任务上的表现 “显著更强”。尤其在“代理式编程(Agentic Coding)”领域,Claude Opus 4.5 达到行业领先水准。根据软件能力评测集 SWE‑Bench Verified 的结果,其得分优于 Gemini 3 Pro 与 GPT‑5.1。

与 OpenAI 不同的是,Anthropic 并未投入大量资源开发图像或视频生成等重算力领域,而是聚焦于编码能力优化与企业自动化部署,尤其强调在程序编译、集成和任务执行等方面的落地实用性,而非人机交互对话功能。目前,该公司已为超过 30 万家企业用户提供服务。

在AI编程生态中,Anthropic 已成为不可忽视的力量。上周,微软英伟达共同宣布对Anthropic投资数十亿美元,公司估值跃升至约 3,500 亿美元。合作协议中最受瞩目的部分,是微软 Azure AI Foundry 的客户可直接访问 Claude 系列模型——这使 Claude 成为全球唯一同时部署在三大云平台(Azure、AWS、Google Cloud) 的前沿大模型。

值得一提的是,Anthropic 也在显著扩大 TPU 的使用。根据报道,公司签署了一项价值数十亿美元的长期云合作协议,未来将使用高达“一百万颗 TPU”,总价值或达“数百亿美元”。这不仅反映出其与谷歌的算力合作关系,也说明外部前沿AI开发者已普遍认可谷歌TPU的性能与成本优势。

根据 Menlo Ventures 7月发布的报告,Anthropic 在企业级 AI 采用率中位居第一,占 32% 市场份额;OpenAI 以 25% 居次(较两年前几乎腰斩),谷歌 20%,Meta 9%。

应用端:OpenAI GPT‑5.1 强化生态布局

长期以来,OpenAI 一直稳居行业“最聪明模型”的头衔。其愿景是创造造福全人类的通用人工智能(AGI),并以“大而全”的战略路线巩固行业主导:产品组合更丰富、组织体系更庞大。

11 月 22 日,OpenAI 正式发布GPT‑5.1。资深AI使用者普遍认为,该版本较前代“明显更智能”。

为迎接假日购物季需求高峰,OpenAI 还于本周一推出免费AI购物搜索功能,试图让聊天模型融入消费者购物流程,从而打造新的商业化场景。

官方博客指出,该功能基于GPT‑5‑Thinking‑Mini 模型优化,通过问答方式收集用户偏好,再在网络中逐步推荐 10 至 15 件商品供筛选。

过去几周,OpenAI 密集更新产品:包括群组聊天功能、面向美国 K‑12 教师的免费版 ChatGPT,以及内置 ChatGPT 的浏览器版本。这显示公司正在积极拓展用户规模与使用场景,以应对增长压力并强化平台生态。

中国 LLM:阿里 Qwen 3 Max 同样出色

中国AI阵营同样迎来突破。11 月 24 日,阿里巴巴 布新一代人工智能交易模型 Qwen 3 Max(通义千问 3 Max)。

产品公开测试仅一周,下载量突破 1,000 万次,刷新全球AI应用历史记录。短短时间内,Qwen 3 Max 在增长速度上超越 ChatGPT、Sora 乃至今年早些时候引发轰动的 DeepSeek,成为史上增速最快的AI产品。

性能方面,Qwen 3 Max‑Preview 在多个权威评测集(MMLU、GSM8K、HumanEval、BIG‑Bench Hard 等)中均刷新通义系列最佳纪录,在部分项目上甚至超越 GPT‑5 与 Claude Opus 4。

受益于其AI云业务的大幅上涨,阿里巴巴虽然在其主营电商业务上表现不算特别出色,市场仍然对这几公司基于了很高的想象空间。

从投资与金融交易维度看,中国AI模型也展现强劲实力。 在 Hyperliquid 交易平台 组织的“Alpha Arena”实盘实验中,每个AI模型均获 1 万美元资金、在同等条件下自主交易加密货币永续合约。 结果显示:DeepSeek 以 57.5% 收益率拔得头筹,而Qwen 3 Max 以 25% 收益率位列第二,累计执行 36 笔交易,夏普比率 0.328,为所有参赛模型中表现最稳定者。

Qwen 3 Max 在策略层面专注于波动性控制与风险均衡,有效避免大型模型常见的“过度交易”与“风险飙升”问题,显示出卓越的稳定性与策略优化能力。

原文链接

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10