DeepSeek上線兩天後再回看：一次「小更新」，一場架構「豪賭」

華爾街見聞

2025/08/22

8月19日晚間，DeepSeek官方悄然上線了全新的V3.1版本。官方公告強調了上下文長度拓展至128k，但隨着社區的深入挖掘和實測，這次「小更新」之下其實有着更多模型架構的變革和模型重點能力的微調，在編程能力上的提升也可圈可點，成本優勢重回顯著。然而，模型融合的技術路線也引發激烈爭論，部分用戶反饋舊版模型的「頑疾」復現，對這次更新的評價呈現出兩極分化的態勢。發布兩天後，DeepSeek官方...

網頁鏈接

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

熱議股票

{"basename":"/hant","ssrTDKData":{"titleTemplate":"%s - 老虎證券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎證券,老虎證券開戶,老虎券商,老虎證券官網,老虎證券app,tigertrade老虎證券,股票,炒股,新加坡股票交易平臺,投資,投資理財","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hant/news/2561037417"},"companyName":"老虎證券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2561037417\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2561037417?lang=zh_TW&edition=fundamental","thumbnail":"https://wpimg-wscn.awtmt.com/618c8602-bf2d-4cbd-a6ef-b6c0b83a4f4f.png","is_english":false,"pubTime":"2025-08-22 07:52","share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","id":"2561037417","market":"hk","top_or_hot":-1,"title":"DeepSeek上線兩天後再回看：一次「小更新」，一場架構「豪賭」","media":"華爾街見聞","content":"<div>\n<p>8月19日晚間，DeepSeek官方悄然上線了全新的V3.1版本。\n官方公告強調了上下文長度拓展至128k，但隨着社區的深入挖掘和實測，這次「小更新」之下其實有着更多模型架構的變革和模型重點能力的微調，在編程能力上的提升也可圈可點，成本優勢重回顯著。\n然而，模型融合的技術路線也引發激烈爭論，部分用戶反饋舊版模型的「頑疾」復現，對這次更新的評價呈現出兩極分化的態勢。\n發布兩天後，DeepSeek官方...</p>\n\n<a href=\"https://wallstreetcn.com/articles/3753850\">網頁鏈接</a>\n\n</div>\n","source":"wallstreetcn_hot_news","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>DeepSeek上線兩天後再回看：一次「小更新」，一場架構「豪賭」</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 12.5px; color: #7E829C; margin: 0;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\nDeepSeek上線兩天後再回看：一次「小更新」，一場架構「豪賭」\n</h2>\n<h4 class=\"meta\">\n<p class=\"head\">\n<strong class=\"h-name small\">華爾街見聞</strong><span class=\"h-time small\">2025-08-22 07:52</span>\n</p>\n</h4>\n</header>\n<article>\n<div>\n<p>8月19日晚間，DeepSeek官方悄然上線了全新的V3.1版本。\n官方公告強調了上下文長度拓展至128k，但隨着社區的深入挖掘和實測，這次「小更新」之下其實有着更多模型架構的變革和模型重點能力的微調，在編程能力上的提升也可圈可點，成本優勢重回顯著。\n然而，模型融合的技術路線也引發激烈爭論，部分用戶反饋舊版模型的「頑疾」復現，對這次更新的評價呈現出兩極分化的態勢。\n發布兩天後，DeepSeek官方...</p>\n\n<a href=\"https://wallstreetcn.com/articles/3753850\">網頁鏈接</a>\n\n</div>\n\n<div class=\"bt-text\">\n\n\n<p> 來源：<a href=\"https://wallstreetcn.com/articles/3753850\">華爾街見聞</a></p>\n<p>為提升您的閱讀體驗，我們對本頁面進行了排版優化</p>\n\n\n</div>\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU0006061336.USD","symbol_name":"Blackrock US Small and MidCap Opportunities A2 USD","start_time":0,"source_url":"https://wallstreetcn.com/articles/3753850","article_id":"2561037417","we_media_id":null,"thumbnails":["https://wpimg-wscn.awtmt.com/618c8602-bf2d-4cbd-a6ef-b6c0b83a4f4f.png"],"rights":{"source":"wallstreetcn_hot_news","url":"https://wallstreetcn.com/articles/3753850","rn_cache_url":null,"directOrigin":true},"url":"https://stock-news.laohu8.com/highlight/detail?id=2561037417","pubTimestamp":1755820329,"columns":[],"sourceInfo":{"source_id":"wallstreetcn_hot_news","name":"华尔街见闻"},"weMediaInfo":null,"summary":"8月19日DeepSeek上線全新的V3.1版本。新模型融合思考與非思考模式，大幅提升編程和智能體能力，成本顯著降低。但這種激進的模型融合策略也引發爭議，部分用户反饋幻覺重現，商業API的無預警更替更引發穩定性質疑。","collect":0,"end_time":0,"defaultTopTitle":"wallstreetcn.com","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU0006061336.USD":"Blackrock US Small and MidCap Opportunities A2 USD","LU0054578231.USD":"BGF SYSTEMATIC SUSTAINABLE GLOBAL SMALLCAP \"A2\" (USD) ACC","RL":"拉夫劳伦","BK4588":"碎股","BK4202":"服装、服饰与奢侈品","BK4585":"ETF&股票定投概念"},"translate_title":"Look back two days after DeepSeek went online: a \"small update\", an architectural \"big gamble\"","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"RL":1},"content_text":"8月19日晚間，DeepSeek官方悄然上線了全新的V3.1版本。\n官方公告強調了上下文長度拓展至128k，但隨着社區的深入挖掘和實測，這次「小更新」之下其實有着更多模型架構的變革和模型重點能力的微調，在編程能力上的提升也可圈可點，成本優勢重回顯著。\n然而，模型融合的技術路線也引發激烈爭論，部分用户反饋舊版模型的「頑疾」復現，對這次更新的評價呈現出兩極分化的態勢。\n發布兩天後，DeepSeek官方在公眾號上發布了相關消息。\n此時，正適合我們回看V3.1，更細緻地拆解這次「小更新」。\n架構之變：V3.1吞掉R1，減輕部署複雜度\n儘管DeepSeek官方在更新通知中將「上下文長度拓展至128k」作為核心亮點，但此前的V3版本早已支持128K上下文，只是官方API接口此前僅開放至64K。\n因此，這次更新的真正核心並非上下文長度，而是模型底層的架構演進。\n根據官方最新發布的公眾號內容，確認了V3.1為混合推理架構，即使用一個模型同時支持思考模式與非思考模式。\n目前在DeepSeek的官方網頁和APP上，即使用户開啓「深度思考」模式，模型的標識也已從過去的「R1」變為了統一的「V3」。\n用户通過API調用推理模型時，模型也明確「告知」自己是V3模型。\n不過這裏和GPT-5自動路由不同，是否打開思考模式，依然是用户控制，而非通過自動的模型路由判斷。\n在過往的經驗中，這種混合模型可能會導致非推理任務，如創意寫作和情商表達等能力的下降。不過，根據社區內用户分析，這種混合可以簡化部署和運維，提高算力利用效率。\n能力優化：編程再提升，成本再下降\n除了架構改變外，V3.1被首先注意到的是編程能力的大幅提升。\n根據社區廣泛引用的Aider編程基準測試數據顯示，DeepSeek V3.1取得了71.6%的高分，在開源模型中成功「霸榜」。\n\n這一成績不僅超越了此前的DeepSeek R1，甚至擊敗了強大的閉源模型Claude 4 Opus。\n在其他權威基準測試中，V3.1同樣表現出色。\n\n\nSVGBench：實力僅次於GPT-4.1-mini，遠超前代DeepSeek R1。\n\n\n\nMMLU：在多任務語言理解方面，V3.1的表現毫不遜色於GPT-5，得分達到88.5%。\n\n\n不過，在研究生級別問答（GPQA）和軟件工程（SWE-Bench verified）等領域，V3.1與GPT-5相比仍存在一定差距。\n在V3.1備受矚目的編程能力實戰中，其表現可圈可點但並非完美。\n在新智元生成一個「黑客帝國風格」的three.js動態世界的任務裏，V3.1成功滿足了基本的功能要求，但對於畫面風格和顏色變換等細節的實現不夠精準，最終效果被測評者評為「80分」。\n\n黑客帝國風格動態世界\n在DeepSeek的傳統強項——成本效益上，V3.1的進化也頗為可觀。\n在社區用户的測試下，完成同樣一次完整的編程任務，V3.1的成本僅需約1.01美元，遠低於Claude 4 Opus（便宜68倍）。從推特網友整理的各主流模型性價比來看，DeepSeek V3的性價比名列前茅。\n\n這裏的數值越低越好\n根據DeepSeek官方宣佈的最新V3.1價格表，其輸入價格為，0.5元/百萬 tokens （緩存命中） ，4元 /百萬 tokens （緩存未命中） 。輸出價格為12元 /百萬 tokens ，該價格於2025 年 9月6日 00：00 起生效。\n\n根據官方解釋，成本下降主要來自於思維鏈壓縮訓練。通過減少無意義的思維鏈輸出，V3.1-Think在輸出token數減少20%-50%的情況下，各項任務的平均表現與R1-0528持平。\n\n這一技術改進不光帶來成本的下降，也讓生成速度顯著提升。社區用户的第一印象都是V3.1比R1速度快了很多。\n最大的升級：智能體能力躍遷\n在前幾天討論中，DeepSeek V3.1的Agent能力的顯著增強並沒有得到太大注意。\n因為這一能力是底層的搜索和工具調用能力的提升，從外部看我們只能看到具體能力，如編程等能力的提升。\n在8月21日正式的發布中，DeepSeek官方特意強調了這一點。通過專門的Post-Training（後訓練）優化，新模型在工具使用與智能體任務中有巨大提升。\n此次升級在複雜的軟件工程和終端控制任務上表現得尤為突出，幾乎實現了跨越式的進步。\n在衡量真實世界代碼修復能力的SWE-bench Verified基準上，V3.1取得了66.0分，遠超前代V3-0324的45.4分和R1-0528的44.6分。而在更具挑戰性的Terminal-Bench（終端操作）測試中，V3.1的得分（31.3）更是達到了前代推理模型R1-0528（5.7）的五倍以上，展現了強大的自動化操作潛力。\n\n除了在專業領域的突破，V3.1在通用的網頁瀏覽和工具調用能力上也獲得了全面增強。在衡量網頁自主導航與信息獲取能力的Browsecomp測試中，其得分從R1-0528的8.9分飆升至30.0分，提升超過三倍。\n同時，在模擬多種工具使用的Seal0基準上，V3.1的得分也從29.7大幅提升至42.6。\n\n即使和目前最先進的模型對比，DeepSeek V3.1的Agent能力也不怯場。\n比如SWE-bench Verified這一測試中，Anthropic的最新模型Claude Opus 4.1 在此基準上更是達到了74.5%的先進水平。而DeepSeek V3.1最新得分為66.0%，高於排名第三的GLM 4.5。\n而在Terminal-Bench中，Claude 4 Opus以43.2%的得分在該項目上表現最佳。GLM-4.5（37.5%）和Claude 4 Sonnet（35.5%）緊隨其後。DeepSeek V3.1的31.3分超過了GPT-4.1（30.3%）和Gemini 2.5 Pro（25.3%）。\n在所有基礎模型都重視的Agent能力的背景下，DeepSeek的這次升級追上了時代，也抹掉了短板。\nV3.1的隱憂：合併模型，是一場豪賭\n儘管V3.1在編程和智能體領域取得了突破，但其核心的「模型融合」策略卻在社區引發了巨大爭議。\n阿里的Qwen模型在嘗試過融合推理後，最終在新版本中還是分開發布了Instruct和Thinking兩種分離的模型。\n而GPT-5的「一體化系統」也則是使用一個智能路由（Router）來調度不同的核心組件，而非直接將模型激進地融合。\n這是因為在上一代模型中，很多基礎模型的「出廠設定」是一個思考模型，其非思考版本僅僅是關閉了系統給模型設定的思考預算。\n但思考模型的訓練，尤其是在強化學習（RL）微調階段，存在一個固有的、難以迴避的權衡問題。\n為了讓模型擅長邏輯、數學和代碼等需要嚴謹推理的任務，強化學習的獎勵（Reward）會高度偏向於那些能夠展現清晰、正確、分步式解題過程的輸出。\n這種對「過程正確性」的極致優化，會深刻地改變模型的底層行為模式。\n模型在處理那些不需要嚴密邏輯、更需要創造力、共情能力或常識性理解的通用任務時，可能會顯得「水土不服」。\n不少用户反饋，V3.1版本重新出現了幻覺嚴重（如在年報總結問題上關鍵信息全部出錯）和中英夾雜的問題，後者在舊版中幾乎不存在。\n此外，模型在面對複雜問題時表現出「能省則省」的傾向，在多次嘗試無果後會主動「放棄」，而不是繼續深度推理，這或許是官方為優化Token使用而做出的權衡。\n這些弊端都可能是混合模型帶來的。\n更令商業API用户不滿的是DeepSeek激進的更新策略。DeepSeek傾向於用新模型直接覆蓋舊模型，且不提供任何舊版本的API。\n這種做法意味着，線上生產業務的API可能在毫無預警的情況下被更改，導致下游工作流崩潰，嚴重影響了商業應用的穩定性。目前在Hugging Face社區，已有API用户對此表達了強烈不滿，要求退款並希望能繼續使用穩定的0324版本。\n\nGPT-5 激進更新的前車之鑑，看來 DeepSeek 並未引以為戒。\n本文作者：博陽 編輯 可君，來源：騰訊科技，原文標題：《DeepSeek上線兩天後再回看：一次「小更新」，一場架構「豪賭」》風險提示及免責條款\n\n            市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"symbols":[],"gpt_button":1,"need_auth":false,"code":"91000000","status":"200"}}}