消費電子：DEEPSEEK-R1降本增效看好ASIC賽道及應用端彈性釋放

天風證券股份有...

2025/02/09

1、近期Deepseek-R1以其較低訓練成本和較強性能引起全球廣泛關注，主要源於其V3基模多項降本提效的創新及R1模型增加的第二階段強化學習訓練對推理能力的大幅提升。預訓練模型V3：關鍵創新表現於1）使用多頭潛在注意力（MLA）機制，將每次查詢所需的 KV 緩存減少了約 93.3%，降低每次查詢所需的硬件量，從而大幅降低了推理成本。2）利用 Multi-Token Prediction (...

網頁鏈接

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

熱議股票

{"basename":"/hant","ssrTDKData":{"titleTemplate":"%s - 老虎證券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎證券,老虎證券開戶,老虎券商,老虎證券官網,老虎證券app,tigertrade老虎證券,股票,炒股,新加坡股票交易平臺,投資,投資理財","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hant/news/2510701043"},"companyName":"老虎證券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2510701043\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2510701043?lang=zh_TW&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-02-09 19:03","share_image_url":"https://static.laohu8.com/9a95c1376e76363c1401fee7d3717173","id":"2510701043","market":"us","top_or_hot":-1,"title":"消費電子：DEEPSEEK-R1降本增效 看好ASIC賽道及應用端彈性釋放","media":"天風證券股份有...","content":"<div>\n<p>1、近期Deepseek-R1以其較低訓練成本和較強性能引起全球廣泛關注，主要源於其V3基模多項降本提效的創新及R1模型增加的第二階段強化學習訓練對推理能力的大幅提升。預訓練模型V3：關鍵創新表現於1）使用多頭潛在注意力（MLA）機制，將每次查詢所需的 KV 緩存減少了約 93.3%，降低每次查詢所需的硬件量，從而大幅降低了推理成本。2） 利用 Multi-Token Prediction (...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250209190320961cdccb&s=b\">網頁鏈接</a>\n\n</div>\n","source":"tencent","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>消費電子：DEEPSEEK-R1降本增效 看好ASIC賽道及應用端彈性釋放</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 12.5px; color: #7E829C; margin: 0;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n消費電子：DEEPSEEK-R1降本增效 看好ASIC賽道及應用端彈性釋放\n</h2>\n<h4 class=\"meta\">\n<p class=\"head\">\n<strong class=\"h-name small\">天風證券股份有...</strong><span class=\"h-time small\">2025-02-09 19:03</span>\n</p>\n</h4>\n</header>\n<article>\n<div>\n<p>1、近期Deepseek-R1以其較低訓練成本和較強性能引起全球廣泛關注，主要源於其V3基模多項降本提效的創新及R1模型增加的第二階段強化學習訓練對推理能力的大幅提升。預訓練模型V3：關鍵創新表現於1）使用多頭潛在注意力（MLA）機制，將每次查詢所需的 KV 緩存減少了約 93.3%，降低每次查詢所需的硬件量，從而大幅降低了推理成本。2） 利用 Multi-Token Prediction (...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250209190320961cdccb&s=b\">網頁鏈接</a>\n\n</div>\n\n<div class=\"bt-text\">\n\n\n<p> 來源：<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250209190320961cdccb&s=b\">天風證券股份有...</a></p>\n<p>為提升您的閱讀體驗，我們對本頁面進行了排版優化</p>\n\n\n</div>\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"ON","symbol_name":"安森美半導體","start_time":0,"source_url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250209190320961cdccb&s=b","article_id":"2510701043","we_media_id":null,"thumbnails":[],"rights":{"source":"tencent","url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250209190320961cdccb&s=b","rn_cache_url":null,"customStyle":"body{padding-top:10px;}#news_title{font-weight:bold;#titleStyle#;}#news_description span{font-size:12px;#descriptionStyle#;}.footer-note{#statement#}","selectors":".mod-LoadTzbdNews, body","filters":".relate-stock, .hot-list, .recom-box, .wx-sou","directOrigin":true},"url":"https://stock-news.laohu8.com/highlight/detail?id=2510701043","pubTimestamp":1739098992,"columns":[],"sourceInfo":{"source_id":"tencent","name":"腾讯"},"weMediaInfo":null,"summary":"3）近期海外AI 鏈公司META、微軟和CLS 最新季度業績表現分化，印證了預訓練增速放緩、後訓練及推理驅動ASIC 快速成長的產業趨勢。2）智能硬件：看好AI 賦能下消費電子產品多元創新。","collect":0,"end_time":0,"defaultTopTitle":"qq.com","property":["earning"],"viewcount":null,"language":"zh","relate_stocks":{"561100":"消费电子ETF富国","561310":"消电ETF国泰","561600":"消费电子ETF平安","562950":"消费电子ETF易方达","ON":"安森美半导体","META":"Meta Platforms, Inc."},"translate_title":"Consumer Electronics: DEEPSEEK-R1 reduces costs and increases efficiency, optimistic about the release of ASIC track and application-side flexibility","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"561100":0.9,"561310":0.9,"561600":0.9,"562950":0.9,"META":0.9,"ON":1},"content_text":"1、近期Deepseek-R1以其較低訓練成本和較強性能引起全球廣泛關注，主要源於其V3基模多項降本提效的創新及R1模型增加的第二階段強化學習訓練對推理能力的大幅提升。預訓練模型V3：關鍵創新表現於1）使用多頭潛在注意力（MLA）機制，將每次查詢所需的 KV 緩存減少了約 93.3%，降低每次查詢所需的硬件量，從而大幅降低了推理成本。2） 利用 Multi-Token Prediction (MTP)新增注意力模塊，預測接下來的多個 token，其在訓練過程中顯著提高了模型性能，並且在推理時可以被移除，利用較低計算資源實現性能提升。3）作為專家混合模型，實現了門控網絡（gating network），以平衡的方式將 token 路由到合適的專家，而不會影響模型性能。提高了訓練效率，同時也降低了推理成本等。增加後訓練的R1：則未使用監督微調而是強化學習微調的方法，展現出從零開始學習推理能力。2、AI 創新範式下後訓練和推理環節的迭代或將為ASIC 帶來重要成長機遇：1）Scaling Law VS新推理範式：2020 年至2023 年間，模型在海量互聯網文本上訓練，只需少量額外訓練。這種以往範式依賴於預訓練，在其他條件相同的情況下，擴大AI 系統的訓練規模會導致在各類認知任務上的性能平穩提升。而這種方式不僅成本越來越高，且已經難以取得穩健的進步。2024 年，使用強化學習（RL）訓練模型生成思維鏈已成為模型擴展的新焦點。其專注於通過合成數據生成和在現有模型上進行後訓練中的強化學習來提升推理能力，其迭代速度更快，仍處於擴展曲線（scaling curve）的早期，且以較少的計算資源即可獲得顯著收益。2）ASIC：AI 領域的ASIC 通過特定算法的定製化優化，實現了高效推理和計算，其特性適用於新範式下訓練模型在特定、可客觀衡量的任務（如數學、編程競賽）及類似推理任務上的表現，且有利於打破GPU壟斷、降低成本。據電子發燒友網公眾號及Marvell 預測，2023 年ASIC 佔數據中心加速計算芯片的16%，規模約為66 億美元；隨着 AI計算需求的增長，ASIC 佔比有望提升至25%，其預計2028 年數據中心ASIC 市場規模將提升至429 億美元，CAGR為45.4%。博通表示谷歌、Meta、亞馬遜都是公司AI 定製芯片的大客户。其CEO 表示，公司2027 年超大規模客户的AI 收入將達到600-900 億美元，幾乎每年翻倍，其預計未來或50%的算力都會是ASIC。3）近期海外AI 鏈公司META、微軟和CLS 最新季度業績表現分化，印證了預訓練增速放緩、後訓練及推理驅動ASIC 快速成長的產業趨勢。Meta 在AI 廣告業務的帶動下收入創歷史新高，其預計2025 年或將構建一個具備中級水平工程師編碼和問題解決能力的AI 智能體，可能成為歷史上最重要的創新之一並發展為一個非常大的市場。微軟的雲計算業務增長放緩，DeepSeek-R1 已可通過微軟的AI 平台獲取，並很快能在微軟AI 電腦Copilot+ PC 上運行。CLS 或受益於定製化趨勢，表示CCS 業務需求強勁，24Q4 收入按年+30%，按月+3%，收入佔比提升6pct 至68%。CCS（Connectivity & Cloud Solutions）為存儲、服務器和通信市場的客户提供定製化的 HPS 產品以及硬件平台解決方案，亞馬遜、谷歌雲、微軟或Meta 或為其大規模客户3、對標傑文斯悖論，持續看好算力投資及算力需求增長趨勢。1）算力需求或將從預訓練端轉移至後訓練及推理端並保持高速增長：根據傑文斯悖論，當某種資源的使用效率提高後，雖然單次使用時消耗更少，但因為成本降低、使用更方便，反而可能讓人們用得更多，導致整體消耗量反而上升，我們認為大模型的發展亦是如此。Anthropic 的CEO 認為各公司在訓練強大的AI 模型上的投入不斷增加，儘管成本曲線會周期性下移，訓練特定智能水平模型的成本也在迅速下降。然而節省下來的成本又被投入到使用相同鉅額預算開發更智能的模型中。2）算力投資持續：扎克伯格在META 業績會中預計，Meta 今年的資本支出將在600 億美元至650 億美元之間，將大力發展人工智能。未來幾年，Meta 還將投入數千億美元用於人工智能基礎設施。微軟預計2025 財年的AI 數據中心方面開支將超過800 億美元。4、AI 應用成本降低的同時或將顯現增長彈性，看好應用端潛力釋放。海外方面看好具備垂直應用轉化軟實力的META等，國內方面看好具備完善生態能力的果鏈及智能硬件創新。1）果鏈：軟硬件創新持續催化，蘋果新一輪產品周期開啓，持續看好新一輪產品周期對於蘋果供應鏈廠商估值和業績提振。2）智能硬件：看好AI 賦能下消費電子產品多元創新。根據 wellsennXR 的預測，2025 年開始，AI 智能眼鏡將在傳統眼鏡銷量保持穩定增長的大背景下快速向傳統眼鏡滲透；2029 年，AI 智能眼鏡年銷量有望達到5500 萬副；到2035 年，AI 智能眼鏡銷量有望達14 億副，看好AI 終端帶動硬件需求提升。建議關注：蘋果產業鏈：立訊精密、領益智造、藍思科技、創新新材（和金屬材料組、機械組聯合覆蓋）、工業富聯、鵬鼎控股、東山精密、珠海冠宇（和電新組聯合覆蓋）、比亞迪電子（港股）、高偉電子（港股）、信維通信、欣旺達（和電新組聯合覆蓋）、水晶光電、長電科技、藍特光學、中石科技等；AI SOC：恒玄、星宸、瑞芯微、晶晨、全志、樂鑫、中科藍訊、炬芯、富瀚微等；國產算力：工業富聯、中芯國際、寒武紀、海光、龍芯中科等；存儲：兆易創新、江波龍風險提示：地緣政治風險、AI 新技術迭代不及預期、下游算力需求不及預期等","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"1","news_tag":"","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}

消費電子：DEEPSEEK-R1降本增效 看好ASIC賽道及應用端彈性釋放

熱議股票

消費電子：DEEPSEEK-R1降本增效看好ASIC賽道及應用端彈性釋放