不藏了!騰訊一口氣發佈超過10個智能體,還批量開源模型 | 最前線

市場資訊
07-27

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:36氪)

作者 | 鄧詠儀

編輯 | 蘇建勳

以往在大模型上一直低調行事,但在AI應用上,騰訊這回終於不藏着了。

7月26日,世界人工智能大會(WAIC)在上海開幕。明顯可見的是,騰訊在WAIC上,讓AI智能體成爲14億用戶的“數字好友”,用智能體構建起了一個“好友圈”,覆蓋用戶生活中的

騰訊也發佈了從自研大模型到智能體的多項新品,可以說是“AI全家桶“,包括:

“現在的AI是從到短期記憶到長期記憶的演進”,騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人吳運聲表示,在很長一段時間裏面,大模型只能記住比較短的上下文,這對複雜任務是不夠的。

而騰訊大力投入到智能體中,也是對技術演進路線的探索。比如多智能體協同——吳運聲表示,AI技術正在從圖文問答向全方位的多模態(視頻、圖像、音頻等)交互演進,全模態的無縫的交互在以後是不要的。而如果有不同的智能體負責不同的專業,去讓各種各樣智能體做協同,才能去完成更加複雜的任務。

△來源:騰訊

2023年,騰訊雲剛剛發佈混元大模型家族時,講的還是“行業大模型”的故事——從金融、政務、運營商等10大行業,主打“行業大模型”的路線,一口氣拋出超過50個解決方案。

但到現在,敘事已經改變,從語言模型迅速擴展到多模態、具身智能。

這次WAIC上,騰訊也首次重點發布了具身智能相關的進展。騰訊旗下的Robotics X實驗室與福田實驗室,聯合發佈了“具身智能開放平臺Tairos”。

△來源:騰訊

這是國內首個以模塊化的方式提供大模型、開發工具和數據服務的具身智能軟件平臺,即插即用,且面向機器人行業開放,爲機器人本體開發商與應用開發商補齊關鍵的軟件能力。

模型和To B/ To C應用兩手抓

在模型側,這次騰訊正式發佈的重點是混元3D世界模型 1.0,並宣佈全面開源。

如果說大語言模型(LLM)的技術演進路線已經逐步明晰,從擴大規模Scale up,到以強化學習(Reinforce Learning)爲主的下半場;那麼多模態的發展階段還在早期,無論是技術選型、高質量數據、模型工程都有多項難點。

多模態則是今年各家比拼的重點,而世界模型也是多模態的一個重要分支,在2024年12月才興起。

簡單來說,騰訊混元3D世界模型1.0融合了全景視覺生成與分層3D重建技術,同時支持文字和圖片輸入,實現了高質量、風格多樣的可漫遊3D場景生成。

△來源:騰訊

過去,3D建模和渲染是個巨大的工程,需要專業建模團隊數週才能搭建。現在,只需一句文字或一張圖片,幾分鐘內即可生成。

談及世界模型的訓練難點,數據是其中一個。騰訊混元3D負責人郭春超在接受包括36氪等媒體採訪時表示,目前3D資產主要依賴於藝術家或建模師的手工製作,因此其數量僅爲幾千萬級,與百億、千億級的圖片數量相比,存在數量級上的差距,這種獲取難度較大的情況是客觀存在的。

對於未來的發展重點,郭春超表示,混元世界模型的目標有兩方面:一是提升3D資產生成的質量,使其達到更高的商用水平。目前,3D資產生成已達到中等水平,但與頂尖水平仍有差距。通過提高生成質量和泛化性,他們希望能更好地滿足遊戲、自動駕駛、XR、動漫及影視等行業的需求,降低成本並縮短週期;

二則是改進場景生成和交互模型,構建更完整、真實模擬物理規律的世界模型,今年重點開展,在明年達到更高成熟度。

今年年初,DeepSeek R1的經驗已經證明,在嶄新的技術領域,搶佔技術話語權,並且做出令人尊敬的工作,能夠獲得巨大的市場回報。

在那之後,各家都紛紛加快了開源步伐。事實上,除本次發佈即開源的混元 3D 世界模型 1.0,混元還將在月底開源一系列小尺寸模型,包含0.5B、1.8B、4B、7B混合推理模型,更輕量、好部署。

騰訊由於遊戲、社交等內容領域的積累,在多模態的探索上,已經是國內第一梯隊的選手。現在,騰訊已經對外提供接近商業模型性能的開源基座,方便社區基於業務和使用場景定製。

據騰訊發佈的公開數據,如今騰訊的圖像、視頻衍生模型數量分別達到1400和1600個,混元3D系列模型社區下載量超過230萬,已成爲全球最受歡迎的3D開源模型。

除了世界模型之外,騰訊混元還披露了包括端側混合推理語言模型、多模態理解模型、遊戲視覺模型等在內的一系列開源計劃。

比如,即將開源的混元-large-vision,就是在LMArena Vision榜單拿下國內第一的多模態理解模型;而專爲遊戲場景優化的、交互式遊戲視頻生成框架“混元GameCraft”,也會在近期對外開源。

落地,還是落地

在大模型的戰略上,騰訊一而貫之的風格是務實,這次的WAIC上,騰訊的主題也是“讓‘好用的AI’成爲普惠生產力”。

騰訊已經將Agent的能力,嵌入到騰訊多個To B及To C應用中,覆蓋生活、工作、學習、娛樂等場景。

在學習場景,QQ瀏覽器QBot提供AI搜索、AI瀏覽、AI辦公、AI學習、AI寫作等功能;ima AI工作臺可以輔助完成日常學習和工作任務,並長期沉澱爲個人的智能化知識庫,也支持加入別人的共享知識庫進行精準問答。

又比如,旅遊規劃Agent。它可以根據參觀者需求,一鍵生成旅行攻略,還可隨時對生成的攻略進行個性化編輯。同時通過內置小程序直接實現無縫下單,真正實現一次輸入,多項指令一步到位。

△來源:騰訊

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10