騰訊放大招:混元3D世界AI模型宣佈開源,直接生成可交互世界

GameLook
08-01

在遊戲、影視等數字內容產業中,構建一個宏大而精細的3D世界,歷來是衡量工業實力的硬指標,也是一項耗時、耗資巨大的工程。一個開放世界遊戲的場景美術團隊,可能需要上百名藝術家耗費數年時間,才能一磚一瓦地搭建出可供玩家探索的虛擬城市或奇幻大陸。

這種高昂的成本與漫長的週期,一直是懸在所有內容創作者頭頂的達摩克利斯之劍。

然而,技術的演進正在爲這一古老難題提供新的解法。在2025年世界人工智能大會上,騰訊發佈並宣佈全面開源其“混元3D世界模型1.0”。根據官方口徑,該技術是“業界首個開源可沉浸漫遊、可交互、可仿真的世界生成模型,爲遊戲開發、VR、數字內容創作等領域帶來了全新的可能性”。

項目體驗地址:https://3d.hunyuan.tencent.com/sceneTo3D

不過雖然官方口徑相當高大上,但GameLook第一時間想到的其實是玩梗。就比如藉助該技術,或許網友可以將最近大火的上海規則怪談做成小遊戲的形式,讓該熱梗在AI 2D圖的基礎上更進一步。

對於不熟悉的讀者簡單介紹一下,最近很火的上海規則怪談系列梗,可以說就是首個藉助AI技術破圈並不斷發展的熱門梗文化。

具體來看,所謂的“上海規則怪談”指的是通過虛構一系列在上海生存需要遵守的“規則”,來戲謔和解構大衆對於上海“高大上”、“精緻”、“排外”等固有印象。

該梗的起源便是網友使用AI繪畫工具生成了一張圖片,畫面中上海的標誌性建築東方明珠塔變成了一座充滿未來科技感的“防禦塔”,正對着一名手握“蜜雪冰城”奶茶的遊客發射激光。而被東方明珠攻擊後,可能會被“開除滬籍”,身份證號前三位被篡改,從此成爲“鄉毋寧”(上海話,意爲鄉下人)。

而在此基礎之上,藉助AI,上海規則怪談又衍生出了全國地標大亂鬥。各地網友紛紛加入創作,爲自己的家鄉設計了對應的“守護神”或“攻擊塔”。

比如廣州塔(小蠻腰)會時空跳躍到上海,與東方明珠塔對射,保護喝蜜雪冰城的廣州人;當遊客喫了西湖醋魚,雷峯塔會變成“治療塔”爲其回血;如果喫熱乾麪時倒入豆漿,黃鶴樓會啓動攻擊。

在C端,在GameLook看來,類似的AI技術也將成爲未來互聯網流行文化的發動機。

當然,如果騰訊的“混元3D世界模型1.0”確實能夠達到其宣稱的效果,如果放到面向企業應用場景的B端,這並非又一個停留在概念演示階段的AI玩具,而是一套直指行業核心痛點——3D世界生產力——的全新解決方案,也標誌着以騰訊爲代表的國內巨頭,正積極投身於這場重塑數字內容生產管線的全球競賽。

具體來看,對於這種3D世界的AI技術,與其暢想普通人“一句話創世”的遙遠未來,不如先審視這項技術能爲當下的專業領域帶來哪些切實變革。而目前在GameLook的視角下,或許最先受益的會是遊戲和廣告這兩個高度依賴3D內容的行業。

在遊戲開發領域,尤其是大型項目的前期驗證階段,混元3D模型堪稱“靈感加速器”。假設一個遊戲策劃團隊構思了一個“蒸汽朋克風格的古代水鄉”核心創意,在過去,他們需要等待美術團隊花費數週甚至數月,才能製作出一個可供體驗的3D原型場景,用以驗證玩法、氛圍和美術方向。

而現在,主創人員或許只需輸入一段描述性文字,AI便能在數分鐘內生成一個符合核心概念的3D世界雛形,並能直接導入Unreal Engine或Unity等主流引擎。

這意味着團隊可以即時在場景中測試角色的移動、光照效果和基本交互,快速迭代創意。這種將原型驗證週期從“月”壓縮到“天”甚至“小時”的效率飛躍,極大地降低了試錯成本,讓更多大膽的創意有了被實現的機會。

同樣,在數字廣告行業,爲客戶量身定製沉浸式、互動式的3D體驗正成爲新趨勢。而藉助混元3D世界模型,廣告公司的創意人員可以快速生成“坐落於雪山之巔的玻璃展廳”或“穿梭於霓虹都市的公路”等多個場景方案,供客戶實時預覽和挑選。

這不僅提升了提案效率,也讓打造輕量化、高品質的互動廣告和虛擬體驗變得更加靈活和經濟。

這項技術之所以能與專業工作流無縫對接,關鍵在於其背後精巧的技術構想。我們可以將其原理通俗地理解爲一個“AI創世兩步走”的過程。

第一步,是“畫皮”——生成全景圖。模型首先會像一個頂級畫師,根據用戶輸入的文字或圖片提示(Prompt),利用類似擴散模型的生成技術,繪製出一幅360度無死角的超高分辨率全景圖。這幅圖決定了整個世界的基礎色調、風格和環境氛圍。

第二步,也是更核心的一步,是“塑骨”——進行分層3D重建。模型會像一位經驗豐富的雕塑家,分析這幅平面的全景圖,智能地預估出其中每一個元素的空間深度和3D結構,並將其“雕刻”成一個立體的三維空間。

但它並非生成一個無法修改的整體“石膏塊”,而是聰明地將場景中的天空、地表、建築、植被等元素識別並拆解爲獨立的、符合行業標準的3D資產(Assets)。這些“零件”可以被開發者在遊戲引擎中自由地移動、替換、編輯,甚至爲其賦予物理屬性。

正是這種“化整爲零”再“無縫銜接”的能力,打通了AI內容生成與傳統CG工業管線的關鍵壁壘,使其成爲真正可用的生產力工具。

放眼全球,這場圍繞AI生成虛擬世界的競賽早已高手雲集。就在不久前,微軟Xbox遊戲工作室展示了其名爲“Muse”的AI模型。如果說騰訊的混元3D模型是一位專注於“靜態世界搭建”的建築師,那麼微軟的Muse則更像一位精於“動態世界推演”的物理學家。通過學習海量玩家的遊戲數據,Muse能夠根據單張遊戲截圖,預測並生成接下來數秒的連貫遊戲畫面,甚至能理解玩家的實時操作並渲染出相應結果。

兩者的路徑雖有不同——一個致力於高效構建可交互的“舞臺”,另一個則在探索如何讓“舞臺上的表演”更加智能和自動化——但其目標卻殊途同歸:將AI深度融入虛擬世界的創造與運行之中。

從微軟的Muse到騰訊開源的混元3D世界模型,我們看到的不僅僅是中國科技公司在全球AI應用浪潮中的奮起直追,更是一種戰略姿態的體現。

開源,意味着騰訊意圖吸引全球開發者共同參與,加速技術迭代,構建一個圍繞AI生成3D內容的生態系統。這不僅是一場技術競賽,更是一場關於未來數字內容生產標準和生態主導權的博弈。

在這個時代,人工智能或許不會完全取代人類創作者,但它正成爲一支強大的催化劑,將開發者從繁重、重複的體力勞動中解放出來,去專注於更高層次的玩法設計、敘事構建和創意表達。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10