
圖片來源:視覺中國
藍鯨新聞4月23日訊(記者 朱儁熹)傳聞中的DeepSeek-V4模型還未露面,前OpenAI研究員姚順雨已率先交出加盟騰訊後的首份答卷——Hy3 preview。
4月23日,騰訊混元正式發布並開源了新一代語言模型Hy3 preview。作為混元團隊重組後訓練的第一個模型,官方將其稱為混元迄今最智能的模型,在複雜推理、指令遵循、上下文學習、代碼、智能體能力以及推理性能上均實現了大幅提升。
模型結構方面,Hy3 preview是一個快慢思考融合的混合專家模型。其總參數規模為295B,激活參數21B,最大支持256K上下文長度。從具體性能表現來看,騰訊混元表示,代碼和智能體是Hy3 preview提升最為顯著的方向。
不過,在SWE-Bench Verified、Terminal-Bench 2.0等主流代碼智能體基準中,Hy3 preview的表現並未超過Anthropic的Claude-Opus-4.5、智譜GLM-5等國內外主流模型。
除了公開排行榜體系,騰訊混元還構建了多個內部評測集,用以評估模型在真實開發場景中的表現。例如,在後端工程任務集Hy-Backend、貼近真實用戶交互的Hy-Vibe Bench,以及高難度軟件工程任務集Hy-SWE Max等內部測試中,Hy3 preview綜合表現優於Kimi-K2.5,但仍未達到Claude-Opus-4.6的水平。
混元團隊此前還聯合復旦大學發布CL-bench和 CL-bench-Life基準測試,基於騰訊業務場景的靈感,用於評估模型的上下文學習能力。在這一評測體系中,Hy3 preview的表現要高於Kimi-K2.5、GLM-5,但仍落後於OpenAI的GPT-5.4 xhigh。
騰訊將Hy3 preview定位為混元快速探索實用性大模型、解決真實世界問題的開端。騰訊首席AI科學家姚順雨表示,這是混元大模型重建的第一步。希望通過此次開源與發布,獲得來自開源社區和用戶的真實反饋,幫助提升Hy3正式版的實用性。同時,公司仍在持續擴大預訓練與強化學習規模,提升模型的智能上限。並通過與騰訊衆多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,開始探索特色模型能力。
過去一年,騰訊混元大模型經歷了「深度重構」。去年12月,姚順雨官宣加入騰訊,出任「CEO/總裁辦公室」首席AI科學家,向騰訊總裁劉熾平彙報;同時兼任AI Infra部、大語言模型部負責人,向技術工程事業群總裁盧山彙報。架構升級後,AI Infra部負責大模型訓練和推理平台技術能力建設,AI Data部、數據計算平台部則分別負責大模型數據及評測體系建設、大數據和機器學習的數據智能融合平台建設工作。
騰訊公司董事會主席兼首席執行官馬化騰在1月的員工大會上表示,姚順雨加入之後,公司加快吸引人才的力度,重構研發團隊,以及在內部加快了Co-design設計,強化混元大模型和元寶的協同。騰訊混元也在人才吸引、組織結構等方面「做了很大的改變」,吸引更多的原生AI人才。
進入今年2月,騰訊混元進一步明確了技術路線,對預訓練和強化學習的基礎設施進行重建,並提出模型追求實用性的三個原則。一是能力體系化,不推崇「偏科」,推動推理、長文、指令、代碼、工具等多能力的協同。二是評測真實性,主動跳出易被「刷榜」的公開排行榜,通過自建題目、人工評測等多種方式評估和改進模型表現。三是性價比追求,大幅降低任務成本,讓智能用得起、用得好。
在成本方面,Hy3 preview的成本相比上一代模型大幅下降,整體推理效率提升40%。騰訊將其歸功於模型與推理框架的深度協同,以及算子性能與量化算法等方面的優化。在騰訊雲大模型服務平台TokenHub上,其輸入價格最低1.2元/百萬tokens,輸入命中緩存價格0.4元/百萬tokens,輸出價格最低4元/百萬tokens。騰訊雲還推出定製的Hy3 preview Token Plan套餐,個人版最低28元/月。
作為參考,月之暗面本周上線的Kimi K2.6模型定價為:每百萬tokens 1.1元(命中緩存)、6.5元(未命中緩存),輸出價格27元/百萬tokens。為慶祝K2.6模型API上線,Kimi開放平台還同步開啓了最高30%的限時充贈活動。
在3月18日舉行的最新財報電話會上,騰訊總裁劉熾平指出,AI是多重並行的競賽世界,當前行業仍處於高度動態變化之中。騰訊的策略是依託現有資源、人才和團隊,在各個層面都進行投入和佈局。他強調,當進入到應用層時,並不完全依賴底層模型能力,更多體現在產品能力、編排能力、連接能力等方面的積累,這正是騰訊的強項所在。
「我並不擔心‘後來者’的問題,更擔心的是如果我們不夠創新、不夠快速該怎麼辦?」劉熾平稱,「隨着我們重組混元團隊,激活所有產品團隊去開展產品創新,我認為這一切正朝着非常令人興奮的方式推進。」