【騰訊發佈並開源混元語音數字人模型】金十數據5月28日訊,騰訊混元發佈並開源的語音數字人模型HunyuanVideo-Avatar,由騰訊混元視頻大模型及騰訊音樂天琴實驗室MuseV技術聯合研發,支持頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向視頻創作者提供高一致性、高動態性的視頻生成能力。用戶可上傳人物圖像與音頻,HunyuanVideo-Avatar模型會自動理解圖片與音頻,比如人物所在環境、音頻所蘊含的情感等,讓圖中人物自然地說話或唱歌,生成包含自然表情、脣形同步及全身動作的視頻。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。