你有想象過喜歡的UP主説英語的樣子嗎？B站上線AI原聲翻譯功能，基於自研模型

IT之家

08/06

IT之家 8 月 6 日消息，Bilibili Index 團隊於 8 月 4 日發佈博文，宣佈通過自研 IndexTTS2 模型，推出“原聲風格”視頻配音功能，可以支持將部分中文視頻翻譯爲外語的原聲風格配音。

IT之家此前曾介紹該功能上線，而在最新博文介紹中，官方介紹了該功能背後的 AI 模型。

該團隊表示通過該自研模型，讓視頻人物不再是千篇一律的“代言人聲線”，而是像本人親自講外語一樣自然，聲音、語氣、節奏，甚至個性表達都和原片幾乎一致，觀衆可以聽到“這個人用另一種語言在說話”。

BILIBILI IndexTTS2 模型架構

該模型創新性地提出了一種通用於 AR 系統的“時間編碼”機制，首次解決了傳統 AR 模型難以精確控制語音時長的問題。這一設計在保留 AR 架構在韻律自然性、風格遷移能力、多模態擴展性等方面優勢的同時，也具備了合成定長語音的能力。

團隊還推出通過音色克隆、聲場一致性、多聲源融合等技術，解決了傳統配音中聲音人格缺失、字幕干擾及本地化成本高等痛點。

系統還針對多說話人場景優化說話人分割、情緒遷移與語速控制，並引入 RIVAL 對抗式強化學習框架提升翻譯質量與風格適配度。

在視頻層面，結合字幕擦除與基於 Diffusion 的高保真脣形同步，確保音畫一致與沉浸感。B站表示，未來將支持更多語言，並計劃開源模型，推動多語言、跨模態內容全球化傳播。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

熱議股票

1
2
3
4
5
6
7
8
9
10

{"basename":"/hant","ssrTDKData":{"titleTemplate":"%s - 老虎證券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎證券,老虎證券開戶,老虎券商,老虎證券官網,老虎證券app,tigertrade老虎證券,股票,炒股,新加坡股票交易平臺,投資,投資理財","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hant/news/2557217993"},"companyName":"老虎證券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2557217993\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2557217993?lang=zh_TW&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-08-06 16:20","share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","id":"2557217993","market":"us","top_or_hot":-1,"title":"你有想象過喜歡的UP主説英語的樣子嗎？B站上線AI原聲翻譯功能，基於自研模型","media":"IT之家","content":"<html><body><p>IT之家 8 月 6 日消息，Bilibili Index 團隊於 8 月 4 日發佈博文，宣佈通過自研 IndexTTS2 模型，推出“原聲風格”視頻配音功能，可以支持將部分中文視頻翻譯爲外語的原聲風格配音。</p><p><img src=\"https://x0.ifengimg.com/ucms/2025_32/CEB49A05BB5DF15B2FB10C2B430A580F18D18036_size39_w1080_h495.jpg\"/></p><p>IT之家此前曾介紹該功能上線，而在最新博文介紹中，官方介紹了該功能背後的 AI 模型。</p><p>該團隊表示通過該自研模型，讓視頻人物不再是千篇一律的“代言人聲線”，而是像本人親自講外語一樣自然，聲音、語氣、節奏，甚至個性表達都和原片幾乎一致，觀衆可以聽到“這個人用另一種語言在說話”。</p><p><img src=\"https://x0.ifengimg.com/ucms/2025_32/462EAFEE4C413B8599145F2EAA8ECDF8A0F8AC51_size11_w604_h157.jpg\"/></p><p>BILIBILI IndexTTS2 模型架構</p><p>該模型創新性地提出了一種通用於 AR 系統的“時間編碼”機制，首次解決了傳統 AR 模型難以精確控制語音時長的問題。這一設計在保留 AR 架構在韻律自然性、風格遷移能力、多模態擴展性等方面優勢的同時，也具備了合成定長語音的能力。</p><p><img src=\"https://x0.ifengimg.com/ucms/2025_32/22E1D816D548BCB8FF71BDF49DC027A0233ED78E_size47_w1080_h400.jpg\"/></p><p>團隊還推出通過音色克隆、聲場一致性、多聲源融合等技術，解決了傳統配音中聲音人格缺失、字幕干擾及本地化成本高等痛點。</p><p>系統還針對多說話人場景優化說話人分割、情緒遷移與語速控制，並引入 RIVAL 對抗式強化學習框架提升翻譯質量與風格適配度。</p><p>在視頻層面，結合字幕擦除與基於 Diffusion 的高保真脣形同步，確保音畫一致與沉浸感。<a href=\"https://laohu8.com/S/BILI\">B站</a>表示，未來將支持更多語言，並計劃開源模型，推動多語言、跨模態內容全球化傳播。</p></body></html>","source":"fenghuang_stock","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>你有想象過喜歡的UP主説英語的樣子嗎？B站上線AI原聲翻譯功能，基於自研模型</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 12.5px; color: #7E829C; margin: 0;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n你有想象過喜歡的UP主説英語的樣子嗎？B站上線AI原聲翻譯功能，基於自研模型\n</h2>\n<h4 class=\"meta\">\n<p class=\"head\">\n<strong class=\"h-name small\">IT之家</strong><span class=\"h-time small\">2025-08-06 16:20</span>\n</p>\n</h4>\n</header>\n<article>\n<html><body><p>IT之家 8 月 6 日消息，Bilibili Index 團隊於 8 月 4 日發佈博文，宣佈通過自研 IndexTTS2 模型，推出“原聲風格”視頻配音功能，可以支持將部分中文視頻翻譯爲外語的原聲風格配音。</p><p><img src=\"https://x0.ifengimg.com/ucms/2025_32/CEB49A05BB5DF15B2FB10C2B430A580F18D18036_size39_w1080_h495.jpg\"/></p><p>IT之家此前曾介紹該功能上線，而在最新博文介紹中，官方介紹了該功能背後的 AI 模型。</p><p>該團隊表示通過該自研模型，讓視頻人物不再是千篇一律的“代言人聲線”，而是像本人親自講外語一樣自然，聲音、語氣、節奏，甚至個性表達都和原片幾乎一致，觀衆可以聽到“這個人用另一種語言在說話”。</p><p><img src=\"https://x0.ifengimg.com/ucms/2025_32/462EAFEE4C413B8599145F2EAA8ECDF8A0F8AC51_size11_w604_h157.jpg\"/></p><p>BILIBILI IndexTTS2 模型架構</p><p>該模型創新性地提出了一種通用於 AR 系統的“時間編碼”機制，首次解決了傳統 AR 模型難以精確控制語音時長的問題。這一設計在保留 AR 架構在韻律自然性、風格遷移能力、多模態擴展性等方面優勢的同時，也具備了合成定長語音的能力。</p><p><img src=\"https://x0.ifengimg.com/ucms/2025_32/22E1D816D548BCB8FF71BDF49DC027A0233ED78E_size47_w1080_h400.jpg\"/></p><p>團隊還推出通過音色克隆、聲場一致性、多聲源融合等技術，解決了傳統配音中聲音人格缺失、字幕干擾及本地化成本高等痛點。</p><p>系統還針對多說話人場景優化說話人分割、情緒遷移與語速控制，並引入 RIVAL 對抗式強化學習框架提升翻譯質量與風格適配度。</p><p>在視頻層面，結合字幕擦除與基於 Diffusion 的高保真脣形同步，確保音畫一致與沉浸感。<a href=\"https://laohu8.com/S/BILI\">B站</a>表示，未來將支持更多語言，並計劃開源模型，推動多語言、跨模態內容全球化傳播。</p></body></html>\n<div class=\"bt-text\">\n\n\n<p> 來源：<a href=\"https://tech.ifeng.com/c/8lbCyd1u3uv\">IT之家</a></p>\n<p>為提升您的閱讀體驗，我們對本頁面進行了排版優化</p>\n\n\n</div>\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU2097828805.USD","symbol_name":"AZ EQUITY CHINA \"A-AZ\" (USD) ACC","start_time":0,"source_url":"https://tech.ifeng.com/c/8lbCyd1u3uv","article_id":"2557217993","we_media_id":null,"thumbnails":[],"rights":null,"url":"https://stock-news.laohu8.com/highlight/detail?id=2557217993","pubTimestamp":1754468415,"columns":[],"sourceInfo":{"source_id":"fenghuang_stock","name":"凤凰网"},"weMediaInfo":null,"summary":"IT之家 8 月 6 日消息，Bilibili Index 團隊於 8 月 4 日發佈博文，宣佈通過自研 IndexTTS2 模型，推出“原聲風格”視頻配音功能，可以支持將部分中文視頻翻譯為外語的原聲風格配音。IT之家此前曾介紹該功能上線，而在最新博文介紹中，官方介紹了該功能背後的 AI 模型。B站表示，未來將支持更多語言，並計劃開源模型，推動多語言、跨模態內容全球化傳播。","collect":0,"end_time":0,"defaultTopTitle":"ifeng.com","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU2097828805.USD":"AZ EQUITY CHINA \"A-AZ\" (USD) ACC","BK4585":"ETF&股票定投概念","BK1587":"次新股","BK4563":"昨日强势股","BK4503":"景林资产持仓","BK4513":"直播概念","LU2097828474.EUR":"AZ EQUITY CHINA \"A\" (EUR) ACC A","BK4566":"资本集团","SG9999003461.SGD":"United Asia Pacific Infrastructure SGD","BK4505":"高瓴资本持仓","BK4085":"互动家庭娱乐","BK4577":"网络游戏","BK4504":"桥水持仓","BK4588":"碎股","IE0034224299.USD":"PINEBRIDGE ASIA EX JAPAN EQUITY \"A\" (USD) ACC","BK1618":"Manus概念股","BK4548":"巴美列捷福持仓","BILI":"哔哩哔哩","SG9999001051.SGD":"United Asia Fund SGD","SG9999006597.SGD":"United China-India Dynamic Growth SGD","LU2097828557.USD":"AZ EQUITY CHINA \"A\" (USD) ACC","BK1588":"回港中概股","BK4509":"腾讯概念","SG9999001069.SGD":"UOB UNITED ASIA PACIFIC GROWTH (SGD) ACC","BK4510":"在线教育","BK1095":"互动媒体与服务","LU2097828631.EUR":"AZ EQUITY CHINA \"A\" (EUR) ACC","BK1104":"互动家庭娱乐","SG9999001093.SGD":"United Greater China Fund A Acc SGD","BK1575":"同股不同权","BK1608":"元宇宙概念","BK4554":"元宇宙及AR概念","BK1615":"港股-互联网","09626":"哔哩哔哩-W","LU2097828714.EUR":"AZ EQUITY CHINA \"BAZ\" (EUR) ACC","BK4077":"互动媒体与服务","BK4531":"中概回港概念","BK4526":"热门中概股"},"translate_title":"Have you ever imagined your favorite UP owner speaking English? Station B launches AI original translation function, based on self-developed model","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"09626":1,"BILI":1},"content_text":"IT之家 8 月 6 日消息，Bilibili Index 團隊於 8 月 4 日發佈博文，宣佈通過自研 IndexTTS2 模型，推出“原聲風格”視頻配音功能，可以支持將部分中文視頻翻譯為外語的原聲風格配音。IT之家此前曾介紹該功能上線，而在最新博文介紹中，官方介紹了該功能背後的 AI 模型。該團隊表示通過該自研模型，讓視頻人物不再是千篇一律的“代言人聲線”，而是像本人親自講外語一樣自然，聲音、語氣、節奏，甚至個性表達都和原片幾乎一致，觀眾可以聽到“這個人用另一種語言在説話”。BILIBILI IndexTTS2 模型架構該模型創新性地提出了一種通用於 AR 系統的“時間編碼”機制，首次解決了傳統 AR 模型難以精確控制語音時長的問題。這一設計在保留 AR 架構在韻律自然性、風格遷移能力、多模態擴展性等方面優勢的同時，也具備了合成定長語音的能力。團隊還推出通過音色克隆、聲場一致性、多聲源融合等技術，解決了傳統配音中聲音人格缺失、字幕干擾及本地化成本高等痛點。系統還針對多説話人場景優化説話人分割、情緒遷移與語速控制，並引入 RIVAL 對抗式強化學習框架提升翻譯質量與風格適配度。在視頻層面，結合字幕擦除與基於 Diffusion 的高保真唇形同步，確保音畫一致與沉浸感。B站表示，未來將支持更多語言，並計劃開源模型，推動多語言、跨模態內容全球化傳播。","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}