作者 | ZeR0
编辑 | 漠影
太卷了!太卷了!
智东西8月2日报道,刚刚,知名AI大模型评测Chatbot Arena放榜!
阿里Qwen3-235B-A22B-Instruct-2507位列大语言模型总榜第三,月之暗面Kimi-K2-0711-preview、深度求索DeepSeek-R1-0528并列为总榜第五,以开源之姿超越Claude 4、GPT-4.1等顶尖闭源模型。
多模态大模型中,字节图像生成模型Seedream-3位列文生图榜第五,字节图像编辑模型Seededit-3.0、字节开源统一多模态基础模型BAGEL、阶跃星辰开源图像编辑模型Step1X-Edit分别位列图像编辑榜第五、第七、第八。
在7月30日公布的Chatbot Arena编程榜单中,深度求索DeepSeek-R1-0528、阿里Qwen3-Coder并列第一,月之暗面Kimi-K2-Instruct位列第七。
其中,阿里Qwen3-235B-A22B-Instruct-2507、阿里Qwen3-Coder、月之暗面Kimi K2均是在7月最新发布的开源模型。
赶在7月收尾、8月开头,中国AI大模型依旧在紧锣密鼓地上新,字节跳动、阶跃星辰、阿里、月之暗面近两天接连公布模型新动作。
周四晚,字节跳动Seed团队发布发布实验性扩散语言模型Seed Diffusion Preview,阶跃星辰开源基础大模型Step3。周五,阿里开源“甜品级”编程模型Qwen3-Coder-30B-A3B-Instruct,月之暗面发布kimi-k2的高速版kimi-k2-turbo-preview。
Hugging Face还在周五发布了中国AI社区7月重点,回溯这一个月来令人眼花缭乱的开源浪潮,包括:
✨ 另一个“DeepSeek时刻”——Kimi K2
✨ Qwen完全矩阵化- Instruct / Thinking / Coder模型跨越30B – 480B参数规模
✨ 多模态浪潮:
GLM-4.1V-Thinking: Image+Text > Text
Intern-S1: Image+Text > Text
Wan 2.2 – Text +Image > video
Skywork-R1V3: Image+Text > Text
Skywork-UniPic: Text > Image / Image > Text
Tar-7B: Any-to-Any
Ming-Lite-Omni-1.5: Any-to-Any
Step3: Image+Text > Text
HunyuanWorld-1: Image > 3D
ThinkSound: Video > Audio
Neta-Lumina: Text > Image
✨ 轻量级、可部署的模型
SmallThinker runs on 1GB RAM
✨ Agentic编程成为主流
Qwen3-Coder: fully spec’d tool calling
GLM-4.5: browser agents, IDE assistant
Qwen3 WebDev demo: text-to-frontend code
✨特定领域和实用的模型/工具/数据集
Science one S1: Scientific model
Agentar DeepFinance: Finance dataset
ObjectClear: Interactive Vision Tool
Qwen3 MT Demo: Machine Translation Tool
其中回顾的7月31个亮眼开源模型、1个框架、1个数据集,来自16家企业、高校或研究机构:阿里(9个)、月之暗面(2个)、智谱(2个)、阶跃星辰(1个)、字节跳动(2个)、昆仑万维(2个)、智源研究院(1个)、中国电信人工智能研究院(1个)、蚂蚁集团(4个)、快手(1个)、捏Ta(1个)、磐石(3个)、上海交通大学(1个)、腾讯(1个)、上海人工智能实验室(1个)、复旦大学(1个)。
1、阿里(9个):编程模型Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct,深度思考模型Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Thinking-2507,基础模型Qwen3-235B-A22B-Instruct-2507、Qwen3-30B-A3B-Instruct-2507,CoT音频模型ThinkSound,统一视频生成模型Wan2.2-TI2V-5B,文生视频模型Wan2.2-T2V-A14B。
2、月之暗面(2个):MoE基础模型Kimi-K2-Base,与Numina团队联合研发的数学定理证明模型Kimina-Prover-72B。
3、智谱(2个):多模态大模型GLM-4.1V-9B-Thinking,基础模型GLM-4.5。
4、阶跃星辰(1个):基础模型Step3。
5、字节跳动(2个):智能体模型Tar-7B,多语言翻译模型Seed-X-Instruct-7B。
6、昆仑万维(2个):多模态推理大模型Skywork-R1V3-38B,多模态统一模型Skywork-UniPic-1.5B。
7、智源研究院(1个):文生配音视频框架MTVCraft。
8、中国电信人工智能研究院(1个):AI-Flow-Ruyi-7B-Preview0704。
9、蚂蚁集团(4个):多模态推理模型M2-Reasoning,多模态大模型
Ming-Lite-Omni-1.5,金融训练数据集Agentar-DeepFinance-100K,交互式深度推理模型KAG-Thinker-en-ch-7b-instruct。
10、快手(1个):自适应思考模型KAT-V1-40B。
11、捏Ta(1个):动漫风格图像生成模型Neta-Lumina。
12、磐石(3个):科学基础大模型S1-Base-671B、S1-Base-8B、S1-Base-32B。
13、上海交通大学(1个):端侧原生大模型SmallThinker-4BA0.6B-Instruct。
14、腾讯(1个):3D世界生成模型HunyuanWorld-1。
15、上海人工智能实验室(1个):科学多模态大模型Intern-S1。
16、复旦大学(1个):语音生成模型MOSS-TTSD-v0.5。
前两天Hugging Face趋势榜前十直接被华人团队包揽。如今最新榜单中,华人团队占据前十中的8席,其中智谱占2席、腾讯占1席、阿里占4席、AI大神李沐的美国创业公司BosonAI占1席。
从最新的Hugging Face趋势榜TOP100,我们梳理出其中的中国AI开源团队名单,主要有14家企业及独立研究机构,分别是智谱、腾讯、阿里、上海人工智能实验室、月之暗面、阶跃星辰、捏Ta、昆仑万维、小红书、字节跳动、蚂蚁集团、深度求索DeepSeek、快手、智源研究院,还有上海交通大学(SmallThinker)、复旦大学(与阶跃星辰合作OmniSVG)、香港城市大学(PusaV1)等高校。
智象未来(HiDream)、美团(MeiGen)、群核科技(SpatialLM)、百度(ERNIE)、稀宇科技(MiniMax)、磐石(ScienceOne)、面壁智能(MiniCPM)等企业的模型虽在最新趋势榜100名开外,但也是中国开源AI生态的重要力量。
加起来,积极拥抱AI开源的中国企业,超过20家。
尤其是阿里,是无人争锋的头号“卷王”,卷得频率直接断层,在7月先后开源了音频模型ThinkSound、多模态推理模型HumanOmniV2、编程模型Qwen3-Coder(480B-A35B-Instruct)、推理模型Qwen3-235B-A22B-Thinking-2507、Qwen3-30B-A3B-Thinking-2507、基础模型Qwen3-235B-A22B-Instruct-2507(非思考版)、电影级视频模型Wan2.2、编程模型Qwen3-Coder-Flash(30B-A3B-Instruct),并将新模型背后的GSPO新算法公开。
以下是位列最新Hugging Face趋势榜TOP100中的中国企业、独立研究机构及上榜模型:
1、智谱(7个):GLM-4.5、GLM-4.5-Air、GLM-4.5-FP8、GLM-4.5-Base、GLM-4.5-Air-FP8、GLM-4.1V-9B-Thinking、GLM-4.5-Air-Base。
2、腾讯(3个):HunyuanWorld-1、Hunyuan3D-2.1、X-Omni-En。
3、阿里(18个):Qwen3-30B-A3B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Thinking-2507、Wan2.2-TI2V-5B、Wan2.2-T2V-A14B、Qwen3-30B-A3B-Thinking-2507、Wan2.2-I2V-A14B、Qwen3-235B-A22B-Instruct-2507、Wan2.2-TI2V-5B-Diffusers、Owen3-30B-A3B-Instruct-2507-FP8、Wan2.2-T2V-A14B-Diffusers、Wan2.2-I2V-A14B-Diffusers、Qwen3-Coder-480B-A35B-Instruct-FP8、Qwen3-0.6B、Qwen3-235B-A22B-Thinking-2507-FP8、Qwen3-30B-A3B、Qwen3-8B。
4、上海人工智能实验室(2个):Intern-S1、Intern-S1-FP8。
5、月之暗面(1个):Kimi-K2-Instruct。
6、阶跃星辰(2个):Step3、OmniSVG(与复旦大学合作)。
7、捏Ta(1个):Neta-Lumina。
8、昆仑万维(1个):Skywork-UniPic-1.5B。
9、小红书(1个):dots.ocr。
10、字节跳动(1个):Seed-X-PPO-7B。
11、蚂蚁集团(1个):Ming-Lite-Omni-1.5。
12、深度求索DeepSeek(2个):DeepSeek-R1、DeepSeek-R1-0528-Qwen3-8B。
13、快手(1个):KAT-V1-40B。
14、智源研究院(1个):bge-m3。
上榜的还有一些知名个人开发者,比如Kijai,虽然无法确定国籍,但从其密集选用国产模型的动作来看,大概率是华人。
unsloth、Comfy-Org、bullerwins、QuantStack、Phr00t、英伟达等海外团队位列趋势榜前100的模型,不少用阿里Qwen3、阿里Wan2.2、智谱GLM-4.1V等模型作为底模进行微调、蒸馏或量化。
最新Hugging Face趋势榜TOP100:
在展现受欢迎程度的“Most likes”榜中,最后一次更新停留在今年3月份的旧版DeepSeek-R1依旧稳居第一。
不过,最受欢迎榜TOP10中,其他9席都是海外开源项目。期待中国开源模型继续追赶,取得更多的突破性进展。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.