作者 | ZeR0
編輯 | 漠影
太捲了!太捲了!
智東西8月2日報道,剛剛,知名AI大模型評測Chatbot Arena放榜!
阿里Qwen3-235B-A22B-Instruct-2507位列大語言模型總榜第三,月之暗面Kimi-K2-0711-preview、深度求索DeepSeek-R1-0528並列爲總榜第五,以開源之姿超越Claude 4、GPT-4.1等頂尖閉源模型。
多模態大模型中,字節圖像生成模型Seedream-3位列文生圖榜第五,字節圖像編輯模型Seededit-3.0、字節開源統一多模態基礎模型BAGEL、階躍星辰開源圖像編輯模型Step1X-Edit分別位列圖像編輯榜第五、第七、第八。
在7月30日公佈的Chatbot Arena編程榜單中,深度求索DeepSeek-R1-0528、阿里Qwen3-Coder並列第一,月之暗面Kimi-K2-Instruct位列第七。
其中,阿里Qwen3-235B-A22B-Instruct-2507、阿里Qwen3-Coder、月之暗面Kimi K2均是在7月最新發布的開源模型。
趕在7月收尾、8月開頭,中國AI大模型依舊在緊鑼密鼓地上新,字節跳動、階躍星辰、阿里、月之暗面近兩天接連公佈模型新動作。
週四晚,字節跳動Seed團隊發佈發佈實驗性擴散語言模型Seed Diffusion Preview,階躍星辰開源基礎大模型Step3。週五,阿里開源“甜品級”編程模型Qwen3-Coder-30B-A3B-Instruct,月之暗面發佈kimi-k2的高速版kimi-k2-turbo-preview。
Hugging Face還在週五發佈了中國AI社區7月重點,回溯這一個月來令人眼花繚亂的開源浪潮,包括:
✨ 另一個“DeepSeek時刻”——Kimi K2
✨ Qwen完全矩陣化- Instruct / Thinking / Coder模型跨越30B – 480B參數規模
✨ 多模態浪潮:
GLM-4.1V-Thinking: Image+Text > Text
Intern-S1: Image+Text > Text
Wan 2.2 – Text +Image > video
Skywork-R1V3: Image+Text > Text
Skywork-UniPic: Text > Image / Image > Text
Tar-7B: Any-to-Any
Ming-Lite-Omni-1.5: Any-to-Any
Step3: Image+Text > Text
HunyuanWorld-1: Image > 3D
ThinkSound: Video > Audio
Neta-Lumina: Text > Image
✨ 輕量級、可部署的模型
SmallThinker runs on 1GB RAM
✨ Agentic編程成爲主流
Qwen3-Coder: fully spec’d tool calling
GLM-4.5: browser agents, IDE assistant
Qwen3 WebDev demo: text-to-frontend code
✨特定領域和實用的模型/工具/數據集
Science one S1: Scientific model
Agentar DeepFinance: Finance dataset
ObjectClear: Interactive Vision Tool
Qwen3 MT Demo: Machine Translation Tool
其中回顧的7月31個亮眼開源模型、1個框架、1個數據集,來自16家企業、高校或研究機構:阿里(9個)、月之暗面(2個)、智譜(2個)、階躍星辰(1個)、字節跳動(2個)、崑崙萬維(2個)、智源研究院(1個)、中國電信人工智能研究院(1個)、螞蟻集團(4個)、快手(1個)、捏Ta(1個)、磐石(3個)、上海交通大學(1個)、騰訊(1個)、上海人工智能實驗室(1個)、復旦大學(1個)。
1、阿里(9個):編程模型Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct,深度思考模型Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Thinking-2507,基礎模型Qwen3-235B-A22B-Instruct-2507、Qwen3-30B-A3B-Instruct-2507,CoT音頻模型ThinkSound,統一視頻生成模型Wan2.2-TI2V-5B,文生視頻模型Wan2.2-T2V-A14B。
2、月之暗面(2個):MoE基礎模型Kimi-K2-Base,與Numina團隊聯合研發的數學定理證明模型Kimina-Prover-72B。
3、智譜(2個):多模態大模型GLM-4.1V-9B-Thinking,基礎模型GLM-4.5。
4、階躍星辰(1個):基礎模型Step3。
5、字節跳動(2個):智能體模型Tar-7B,多語言翻譯模型Seed-X-Instruct-7B。
6、崑崙萬維(2個):多模態推理大模型Skywork-R1V3-38B,多模態統一模型Skywork-UniPic-1.5B。
7、智源研究院(1個):文生配音視頻框架MTVCraft。
8、中國電信人工智能研究院(1個):AI-Flow-Ruyi-7B-Preview0704。
9、螞蟻集團(4個):多模態推理模型M2-Reasoning,多模態大模型
Ming-Lite-Omni-1.5,金融訓練數據集Agentar-DeepFinance-100K,交互式深度推理模型KAG-Thinker-en-ch-7b-instruct。
10、快手(1個):自適應思考模型KAT-V1-40B。
11、捏Ta(1個):動漫風格圖像生成模型Neta-Lumina。
12、磐石(3個):科學基礎大模型S1-Base-671B、S1-Base-8B、S1-Base-32B。
13、上海交通大學(1個):端側原生大模型SmallThinker-4BA0.6B-Instruct。
14、騰訊(1個):3D世界生成模型HunyuanWorld-1。
15、上海人工智能實驗室(1個):科學多模態大模型Intern-S1。
16、復旦大學(1個):語音生成模型MOSS-TTSD-v0.5。
前兩天Hugging Face趨勢榜前十直接被華人團隊包攬。如今最新榜單中,華人團隊佔據前十中的8席,其中智譜佔2席、騰訊佔1席、阿里佔4席、AI大神李沐的美國創業公司BosonAI佔1席。
從最新的Hugging Face趨勢榜TOP100,我們梳理出其中的中國AI開源團隊名單,主要有14家企業及獨立研究機構,分別是智譜、騰訊、阿里、上海人工智能實驗室、月之暗面、階躍星辰、捏Ta、崑崙萬維、小紅書、字節跳動、螞蟻集團、深度求索DeepSeek、快手、智源研究院,還有上海交通大學(SmallThinker)、復旦大學(與階躍星辰合作OmniSVG)、香港城市大學(PusaV1)等高校。
智象未來(HiDream)、美團(MeiGen)、羣核科技(SpatialLM)、百度(ERNIE)、稀宇科技(MiniMax)、磐石(ScienceOne)、面壁智能(MiniCPM)等企業的模型雖在最新趨勢榜100名開外,但也是中國開源AI生態的重要力量。
加起來,積極擁抱AI開源的中國企業,超過20家。
尤其是阿里,是無人爭鋒的頭號“卷王”,卷得頻率直接斷層,在7月先後開源了音頻模型ThinkSound、多模態推理模型HumanOmniV2、編程模型Qwen3-Coder(480B-A35B-Instruct)、推理模型Qwen3-235B-A22B-Thinking-2507、Qwen3-30B-A3B-Thinking-2507、基礎模型Qwen3-235B-A22B-Instruct-2507(非思考版)、電影級視頻模型Wan2.2、編程模型Qwen3-Coder-Flash(30B-A3B-Instruct),並將新模型背後的GSPO新算法公開。
以下是位列最新Hugging Face趨勢榜TOP100中的中國企業、獨立研究機構及上榜模型:
1、智譜(7個):GLM-4.5、GLM-4.5-Air、GLM-4.5-FP8、GLM-4.5-Base、GLM-4.5-Air-FP8、GLM-4.1V-9B-Thinking、GLM-4.5-Air-Base。
2、騰訊(3個):HunyuanWorld-1、Hunyuan3D-2.1、X-Omni-En。
3、阿里(18個):Qwen3-30B-A3B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Thinking-2507、Wan2.2-TI2V-5B、Wan2.2-T2V-A14B、Qwen3-30B-A3B-Thinking-2507、Wan2.2-I2V-A14B、Qwen3-235B-A22B-Instruct-2507、Wan2.2-TI2V-5B-Diffusers、Owen3-30B-A3B-Instruct-2507-FP8、Wan2.2-T2V-A14B-Diffusers、Wan2.2-I2V-A14B-Diffusers、Qwen3-Coder-480B-A35B-Instruct-FP8、Qwen3-0.6B、Qwen3-235B-A22B-Thinking-2507-FP8、Qwen3-30B-A3B、Qwen3-8B。
4、上海人工智能實驗室(2個):Intern-S1、Intern-S1-FP8。
5、月之暗面(1個):Kimi-K2-Instruct。
6、階躍星辰(2個):Step3、OmniSVG(與復旦大學合作)。
7、捏Ta(1個):Neta-Lumina。
8、崑崙萬維(1個):Skywork-UniPic-1.5B。
9、小紅書(1個):dots.ocr。
10、字節跳動(1個):Seed-X-PPO-7B。
11、螞蟻集團(1個):Ming-Lite-Omni-1.5。
12、深度求索DeepSeek(2個):DeepSeek-R1、DeepSeek-R1-0528-Qwen3-8B。
13、快手(1個):KAT-V1-40B。
14、智源研究院(1個):bge-m3。
上榜的還有一些知名個人開發者,比如Kijai,雖然無法確定國籍,但從其密集選用國產模型的動作來看,大概率是華人。
unsloth、Comfy-Org、bullerwins、QuantStack、Phr00t、英偉達等海外團隊位列趨勢榜前100的模型,不少用阿里Qwen3、阿里Wan2.2、智譜GLM-4.1V等模型作爲底模進行微調、蒸餾或量化。
最新Hugging Face趨勢榜TOP100:
在展現受歡迎程度的“Most likes”榜中,最後一次更新停留在今年3月份的舊版DeepSeek-R1依舊穩居第一。
不過,最受歡迎榜TOP10中,其他9席都是海外開源項目。期待中國開源模型繼續追趕,取得更多的突破性進展。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。