微軟發布 DragonV2.1 模型，AI 轉錄語音更自然、更富表現力

市場資訊

2025/07/31

　　炒股就看金麒麟分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！

（來源：IT之家）

IT之家 7 月 31 日消息，科技媒體 NeoWin 今天（7 月 31 日）發布博文，報道稱微軟推出了 DragonV2.1Neural 零次學習（Zero-Shot Learning）模型，僅憑少量數據就能創建更加自然、表現力強的聲音，並支持超過 100 種語言。

IT之家援引博文介紹，這是一種零次學習的文本到語音（TTS）模型，承諾提供更加自然和富有表現力的聲音，並提高了發音的準確性以及增強了可控性。

新模型僅需幾秒鐘的語音樣本即可合成超過 100 種語言的語音。相比之下，之前的 DragonV1 模型在處理專有名詞時存在發音問題。DragonV2.1 模型可以應用於多種不同場景，包括定製聊天機器人聲音和為視頻內容跨多語言配音。

微軟表示，DragonV2.1 提高發音準確性，與 DragonV1 相比，該模型單詞錯誤率（WER）平均降低了 12.8%。

該模型還提升了聲音的自然度，用戶使用此模型時，可以利用 SSML 音素標籤和自定義詞典對發音和口音進行細緻控制。為了幫助用戶入門，微軟構建了 Andrew、Ava 和 Brian 等多個聲音檔案，供用戶測試。

海量資訊、精準解讀，盡在新浪財經APP

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

熱議股票

1
2
3
4
5
6
7
8
9
10

{"basename":"/hant","ssrTDKData":{"titleTemplate":"%s - 老虎證券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎證券,老虎證券開戶,老虎券商,老虎證券官網,老虎證券app,tigertrade老虎證券,股票,炒股,新加坡股票交易平臺,投資,投資理財","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hant/news/2555003102"},"companyName":"老虎證券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2555003102\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2555003102?lang=zh_TW&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-07-31 12:59","share_image_url":"https://static.laohu8.com/b0d1b7e8843deea78cc308b15114de44","id":"2555003102","market":"fut","top_or_hot":-1,"title":"微軟發布 DragonV2.1 模型，AI 轉錄語音更自然、更富表現力","media":"市場資訊","content":"<html><body><div>\n<blockquote><p>　　炒股就看<a href=\"https://laohu8.com/S/603586\">金麒麟</a>分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！</p></blockquote> <p>（來源：IT之家）</p><p cms-style=\"font-L\">IT之家 7 月 31 日消息，科技媒體 NeoWin 今天（7 月 31 日）發布博文，報道稱<a href=\"https://laohu8.com/S/MSFT\">微軟</a>推出了 DragonV2.1Neural 零次學習（Zero-Shot Learning）模型，<font cms-style=\"font-L strong-Bold\">僅憑少量數據就能創建更加自然、表現力強的聲音，並支持超過 100 種語言。</font></p><p cms-style=\"font-L\">IT之家援引博文介紹，這是一種零次學習的文本到語音（TTS）模型，承諾提供更加自然和富有表現力的聲音，並提高了發音的準確性以及增強了可控性。</p><p cms-style=\"font-L\">新模型僅需幾秒鐘的語音樣本即可合成超過 100 種語言的語音。相比之下，之前的 DragonV1 模型在處理專有名詞時存在發音問題。DragonV2.1 模型可以應用於多種不同場景，包括定製聊天<span>機器人</span><span></span>聲音和為視頻內容跨多語言配音。</p><p cms-style=\"font-L\">微軟表示，DragonV2.1 提高發音準確性，與 DragonV1 相比，該模型單詞錯誤率（WER）平均降低了 12.8%。</p><div><img src=\"http://n.sinaimg.cn/spider20250731/150/w660h290/20250731/f3bd-f673937cd94b54c9b8d45f85913d9315.jpg\"/><span></span></div><div><img src=\"http://n.sinaimg.cn/spider20250731/150/w660h290/20250731/6b22-77fd9e9c0868672bf864bc90b38c0a7c.jpg\"/><span></span></div><p cms-style=\"font-L\">該模型還提升了聲音的自然度，用戶使用此模型時，可以利用 SSML 音素標籤和自定義詞典對發音和口音進行細緻控制。為了幫助用戶入門，微軟構建了 Andrew、Ava 和 Brian 等多個聲音檔案，供用戶測試。</p>\n<div>\n<div><img src=\"\"/></div>\n<div>海量資訊、精準解讀，盡在新浪財經APP</div>\n</div>\n</div></body></html>","source":"sina","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>微軟發布 DragonV2.1 模型，AI 轉錄語音更自然、更富表現力</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 12.5px; color: #7E829C; margin: 0;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n微軟發布 DragonV2.1 模型，AI 轉錄語音更自然、更富表現力\n</h2>\n<h4 class=\"meta\">\n<p class=\"head\">\n<strong class=\"h-name small\">市場資訊</strong><span class=\"h-time small\">2025-07-31 12:59</span>\n</p>\n</h4>\n</header>\n<article>\n<html><body><div>\n<blockquote><p>　　炒股就看<a href=\"https://laohu8.com/S/603586\">金麒麟</a>分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！</p></blockquote> <p>（來源：IT之家）</p><p cms-style=\"font-L\">IT之家 7 月 31 日消息，科技媒體 NeoWin 今天（7 月 31 日）發布博文，報道稱<a href=\"https://laohu8.com/S/MSFT\">微軟</a>推出了 DragonV2.1Neural 零次學習（Zero-Shot Learning）模型，<font cms-style=\"font-L strong-Bold\">僅憑少量數據就能創建更加自然、表現力強的聲音，並支持超過 100 種語言。</font></p><p cms-style=\"font-L\">IT之家援引博文介紹，這是一種零次學習的文本到語音（TTS）模型，承諾提供更加自然和富有表現力的聲音，並提高了發音的準確性以及增強了可控性。</p><p cms-style=\"font-L\">新模型僅需幾秒鐘的語音樣本即可合成超過 100 種語言的語音。相比之下，之前的 DragonV1 模型在處理專有名詞時存在發音問題。DragonV2.1 模型可以應用於多種不同場景，包括定製聊天<span>機器人</span><span></span>聲音和為視頻內容跨多語言配音。</p><p cms-style=\"font-L\">微軟表示，DragonV2.1 提高發音準確性，與 DragonV1 相比，該模型單詞錯誤率（WER）平均降低了 12.8%。</p><div><img src=\"http://n.sinaimg.cn/spider20250731/150/w660h290/20250731/f3bd-f673937cd94b54c9b8d45f85913d9315.jpg\"/><span></span></div><div><img src=\"http://n.sinaimg.cn/spider20250731/150/w660h290/20250731/6b22-77fd9e9c0868672bf864bc90b38c0a7c.jpg\"/><span></span></div><p cms-style=\"font-L\">該模型還提升了聲音的自然度，用戶使用此模型時，可以利用 SSML 音素標籤和自定義詞典對發音和口音進行細緻控制。為了幫助用戶入門，微軟構建了 Andrew、Ava 和 Brian 等多個聲音檔案，供用戶測試。</p>\n<div>\n<div><img src=\"\"/></div>\n<div>海量資訊、精準解讀，盡在新浪財經APP</div>\n</div>\n</div></body></html>\n<div class=\"bt-text\">\n\n\n<p> 來源：<a href=\"https://finance.sina.com.cn/stock/t/2025-07-31/doc-infiitzy9224466.shtml\">市場資訊</a></p>\n<p>為提升您的閱讀體驗，我們對本頁面進行了排版優化</p>\n\n\n</div>\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU0310800379.SGD","symbol_name":"FTIF - Templeton Global A Acc SGD","start_time":0,"source_url":"https://finance.sina.com.cn/stock/t/2025-07-31/doc-infiitzy9224466.shtml","article_id":"2555003102","we_media_id":null,"thumbnails":[],"rights":null,"url":"https://stock-news.laohu8.com/highlight/detail?id=2555003102","pubTimestamp":1753937940,"columns":[],"sourceInfo":{"source_id":"sina","name":"sina"},"weMediaInfo":null,"summary":"IT之家 7 月 31 日消息，科技媒體 NeoWin 今天發布博文，報道稱微軟推出了 DragonV2.1Neural 零次學習模型，僅憑少量數據就能創建更加自然、表現力強的聲音，並支持超過 100 種語言。相比之下，之前的 DragonV1 模型在處理專有名詞時存在發音問題。DragonV2.1 模型可以應用於多種不同場景，包括定製聊天機器人聲音和為視頻內容跨多語言配音。微軟表示，DragonV2.1 提高發音準確性，與 DragonV1 相比，該模型單詞錯誤率平均降低了 12.8%。","collect":0,"end_time":0,"defaultTopTitle":"sina.com.cn","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU0310800379.SGD":"FTIF - Templeton Global A Acc SGD","LU1196500208.SGD":"NORDEA STABLE RETURN \"HB\" (SGDHDG) ACC","LU1069347547.HKD":"AB SICAV I - GLOBAL VALUE PORTFOLIO \"AD\" (HKD) INC","LU2023250504.SGD":"Allianz Thematica Cl AMg DIS H2-SGD","LU0158827781.USD":" ALLIANZ GLOBAL SUSTAINABILITY \"AT\" (USD) ACC","LU0494093205.USD":"贝莱德ESG灵活多元资产A2 USD-H","LU1720051017.SGD":"Allianz Global Artificial Intelligence AT Acc H2-SGD","LU1059921491.USD":"NORDEA 1 GLOBAL STABLE EQUITY \"HB\" (USDHDG) ACC","LU0672654240.SGD":"FTIF - Franklin US Opportunities A Acc SGD-H1","LU2210149790.SGD":"Natixis Thematics Subscription Economy R/A SGD-H","IE00BWXC8680.SGD":"PINEBRIDGE US LARGE CAP RESEARCH ENHANCED \"A5\" (SGD) ACC","LU0553294199.USD":"BGF GLOBAL EQUITY INCOME \"A5G\" (USD) INC","LU2065171402.SGD":"M&G (LUX) GLOBAL MAXIMA \"A\" (SGD) INC","LU2237957902.USD":"NIKKO AM GLOBAL EQUITY \"F\" (USD) ACC","LU0149725797.USD":"汇丰美国股市经济规模基金","LU1582987324.SGD":"M&G (LUX) INCOME ALLOCATION \"A-H\" (SGDHDG) ACC","LU2279689827.SGD":"JPMorgan Investment Funds - Global Income Sustainable A (mth) SGD-H","LU2168564495.EUR":"AZ ALLOCATION - TREND \"AI\" (EUR) ACC","IE00BJTD4N35.SGD":"Neuberger Berman US Long Short Equity A1  Acc SGD-H","LU1935043023.USD":"MANULIFE GF GLOBAL MULTI-ASSET DIVERSIFIED INCOME \"AA\" (USD) INC A","BK4592":"伊斯兰概念","IE00B1XK9C88.USD":"PINEBRIDGE US LARGE CAP RESEARCH ENHANCED \"A\" (USD) ACC","LU0097036916.USD":"贝莱德美国增长A2 USD","LU2326559502.SGD":"Natixis Loomis Sayles US Growth Equity P/A SGD-H","LU1712237335.SGD":"Natixis Mirova Global Sustainable Equity H-R-NPF/A SGD","LU1280957306.USD":"THREADNEEDLE (LUX) US CONTRARIAN CORE EQUITIES \"AUP\" (USD) INC","LU1236620750.USD":"HSBC GIF GLOBAL SUSTAINABLE LONG TERM DIVIDEND \"AM2\" (USD) INC","LU2247934214.USD":"FIDELITY FUNDS SUSTAINABLE FUTURE CONNECTIVITY \"A\" (USD) ACC","IE0003U64NQ7.SGD":"PIMCO BALANCED INCOME AND GROWTH \"M\" (SGDHDG) ACC","LU0225283273.USD":"SCHRODER ISF GLOBAL EQUITY ALPHA \"A\" (USD) ACC","LU0289960550.SGD":"AB FCP I - GLOBAL EQUITY BLEND PORTFOLIO 'A' (SGD) ACC","LU1221951046.USD":"NORDEA 1 STABLE RETURN \"HM\" (USDHDG) INC","LU1935042215.USD":"MANULIFE GF GLOBAL MULTI-ASSET DIVERSIFIED INCOME  \"AA\" (USD) INC A","LU2750360641.GBP":"INVESCO GLOBAL EQUITY INCOME ADVANTAGE \"A\" (GBPHDG) INC","LU2092937148.SGD":"Blackrock ESG Multi-Asset A8 SGD-H","LU0820562030.AUD":"ALLIANZ INCOME AND GROWTH \"AMH2\" (AUDHDG) H2 INC","LU2764263039.SGD":"BGF GLOBAL UNCONSTRAINED EQUITY \"A2\" (SGDHDG) ACC","SGXZ31699556.SGD":"UGDP UNITED GLOBAL QUALITY GROWTH \"C\" (SGDHDG) ACC","IE00BFSS8Q28.SGD":"Janus Henderson Balanced A Inc SGD-H","LU2063271972.USD":"富兰克林创新领域基金","LU0211327993.USD":"TEMPLETON GLOBAL EQUITY INCOME \"A\" (USD) ACC","LU2023251221.USD":"ALLIANZ GLOBAL SUSTAINABILITY \"AM\" (USD) INC","BK4598":"佩洛西持仓","MSFT":"微软","IE00BKVL7J92.USD":"Legg Mason ClearBridge - US Equity Sustainability Leaders A Acc USD","LU0795875169.SGD":"JPMorgan Investment Funds - Global Income A (div) SGD-H","LU2360108059.USD":"BGF CIRCULAR ECONOMY \"A4\" (USD) INC","LU2602419157.SGD":"HSBC ISLAMIC GLOBAL EQUITY INDEX \"AC\" (SGD) ACC","LU0077335932.USD":"FIDELITY AMERICAN GROWTH \"A\" INC","LU0784383803.USD":"BGF GLOBAL MULTI-ASSET INCOME FUND \"A\" (USD) INC A"},"translate_title":"Microsoft releases DragonV2.1 model, making AI transcribed speech more natural and expressive","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"MSFT":1},"content_text":"炒股就看金麒麟分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！ （來源：IT之家）IT之家 7 月 31 日消息，科技媒體 NeoWin 今天（7 月 31 日）發布博文，報道稱微軟推出了 DragonV2.1Neural 零次學習（Zero-Shot Learning）模型，僅憑少量數據就能創建更加自然、表現力強的聲音，並支持超過 100 種語言。IT之家援引博文介紹，這是一種零次學習的文本到語音（TTS）模型，承諾提供更加自然和富有表現力的聲音，並提高了發音的準確性以及增強了可控性。新模型僅需幾秒鐘的語音樣本即可合成超過 100 種語言的語音。相比之下，之前的 DragonV1 模型在處理專有名詞時存在發音問題。DragonV2.1 模型可以應用於多種不同場景，包括定製聊天機器人聲音和為視頻內容跨多語言配音。微軟表示，DragonV2.1 提高發音準確性，與 DragonV1 相比，該模型單詞錯誤率（WER）平均降低了 12.8%。該模型還提升了聲音的自然度，用户使用此模型時，可以利用 SSML 音素標籤和自定義詞典對發音和口音進行細緻控制。為了幫助用户入門，微軟構建了 Andrew、Ava 和 Brian 等多個聲音檔案，供用户測試。\n\n\n海量資訊、精準解讀，盡在新浪財經APP","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"1","news_tag":"productRelease","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}