超越DeepSeek！阿里Qwen3來了，就這？

雷科技

2025/04/30

今天（4 月 29 日）凌晨，阿里巴巴推出了 4 月壓軸的一款大語言模型——Qwen3 系列。而在這個月，Meta、字節跳動、OpenAI、Google、百度都在稍早前推出了新的大模型，OpenAI 甚至一次性拿出三款大模型，百度也在這周舉行的 Create 2025 百度 AI 開發者大會上發布了兩款大模型。但在這一衆新模型中，阿里還能搞出什麼新意？事實上還真有，除了繼續保持開源路線，Qwen3...

網頁鏈接

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

熱議股票

{"basename":"/hant","ssrTDKData":{"titleTemplate":"%s - 老虎證券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎證券,老虎證券開戶,老虎券商,老虎證券官網,老虎證券app,tigertrade老虎證券,股票,炒股,新加坡股票交易平臺,投資,投資理財","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hant/news/2531903686"},"companyName":"老虎證券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2531903686\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2531903686?lang=zh_TW&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-04-30 19:22","share_image_url":"https://static.laohu8.com/9a95c1376e76363c1401fee7d3717173","id":"2531903686","market":"hk","top_or_hot":-1,"title":"超越DeepSeek！阿里Qwen3來了，就這？","media":"雷科技","content":"<div>\n<p>今天（4 月 29 日）凌晨，阿里巴巴推出了 4 月壓軸的一款大語言模型——Qwen3 系列。而在這個月，Meta、字節跳動、OpenAI、Google、百度都在稍早前推出了新的大模型，OpenAI 甚至一次性拿出三款大模型，百度也在這周舉行的 Create 2025 百度 AI 開發者大會上發布了兩款大模型。但在這一衆新模型中，阿里還能搞出什麼新意？事實上還真有，除了繼續保持開源路線，Qwen3...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250430193933a6ceca8b&s=b\">網頁鏈接</a>\n\n</div>\n","source":"tencent","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>超越DeepSeek！阿里Qwen3來了，就這？</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 12.5px; color: #7E829C; margin: 0;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n超越DeepSeek！阿里Qwen3來了，就這？\n</h2>\n<h4 class=\"meta\">\n<p class=\"head\">\n<strong class=\"h-name small\">雷科技</strong><span class=\"h-time small\">2025-04-30 19:22</span>\n</p>\n</h4>\n</header>\n<article>\n<div>\n<p>今天（4 月 29 日）凌晨，阿里巴巴推出了 4 月壓軸的一款大語言模型——Qwen3 系列。而在這個月，Meta、字節跳動、OpenAI、Google、百度都在稍早前推出了新的大模型，OpenAI 甚至一次性拿出三款大模型，百度也在這周舉行的 Create 2025 百度 AI 開發者大會上發布了兩款大模型。但在這一衆新模型中，阿里還能搞出什麼新意？事實上還真有，除了繼續保持開源路線，Qwen3...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250430193933a6ceca8b&s=b\">網頁鏈接</a>\n\n</div>\n\n<div class=\"bt-text\">\n\n\n<p> 來源：<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250430193933a6ceca8b&s=b\">雷科技</a></p>\n<p>為提升您的閱讀體驗，我們對本頁面進行了排版優化</p>\n\n\n</div>\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"BABA","symbol_name":"阿里巴巴","start_time":0,"source_url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250430193933a6ceca8b&s=b","article_id":"2531903686","we_media_id":null,"thumbnails":[],"rights":{"source":"tencent","url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20250430193933a6ceca8b&s=b","rn_cache_url":null,"customStyle":"body{padding-top:10px;}#news_title{font-weight:bold;#titleStyle#;}#news_description span{font-size:12px;#descriptionStyle#;}.footer-note{#statement#}","selectors":".mod-LoadTzbdNews, body","filters":".relate-stock, .hot-list, .recom-box, .wx-sou","directOrigin":true},"url":"https://stock-news.laohu8.com/highlight/detail?id=2531903686","pubTimestamp":1746012169,"columns":[],"sourceInfo":{"source_id":"tencent","name":"腾讯"},"weMediaInfo":null,"summary":"今天凌晨，阿里巴巴推出了 4 月壓軸的一款大語言模型——Qwen3 系列。跑分追上頂級閉源模型，阿里 Qwen3 成色幾何？另一方面，Qwen3 團隊還強調了 Agent 能力的增強以及對 MCP 的支持，算是順理成章，但目前還沒有看出亮眼的地方。想複製 DeepSeek 的影響力，很難。圖/ X不過 OpenAI、DeepSeek、Google 以及 Anthropic 等公司接連發布的強力模型，阿里此前更多是追隨者角色，很難形成技術引領的姿態。Qwen3 系列的推出，無疑是一場重要的補強，也在某種程度上緩解了這種局面。","collect":0,"end_time":0,"defaultTopTitle":"qq.com","property":["earning"],"viewcount":null,"language":"zh","relate_stocks":{"89988":"阿里巴巴-WR","BABA":"阿里巴巴","09988":"阿里巴巴-W"},"translate_title":"Beyond DeepSeek! Ali Qwen3 is here, that's it?","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"89988":0.9,"09988":0.9,"BABA":0.9},"content_text":"今天（4 月 29 日）凌晨，阿里巴巴推出了 4 月壓軸的一款大語言模型——Qwen3 系列。而在這個月，Meta、字節跳動、OpenAI、Google、百度都在稍早前推出了新的大模型，OpenAI 甚至一次性拿出三款大模型，百度也在這周舉行的 Create 2025 百度 AI 開發者大會上發布了兩款大模型。但在這一眾新模型中，阿里還能搞出什麼新意？事實上還真有，除了繼續保持開源路線，Qwen3 系列作為阿里定位中的旗艦大模型，在模型性能上也有了不小的進步，再次縮小與頂尖大模型之間的能力差。此外，Qwen3 系列還是一款混合推理模型，甚至官方博文的標題就是《Qwen3：思深，行速》。簡單來説，Qwen3 支持思考模式和非思考模式，而不像 DeepSeek 深度思考下是 R1，關閉深度思考其實是 V3。圖/雷科技關於混合推理模型，雷科技在今年 2 月就報道並介紹了首款混合推理模型，以及混合推理的優勢所在，並指出：「混合推理模式」可能會成為大模型發展的下一個標準配置。而回到阿里啱啱發布的 Qwen3 系列，作為國內首個混合推理模型，也是首個混合推理開源模型，再加上模型性能方面的進步，也難怪 Qwen3 推出僅僅四個小時後，就在全球最大開發者社區 Github 拿到了 1.7 萬個 Star。問題在於，在模型跑分越來越受爭議的今天，Qwen3 系列實際上真能兑現跑分體現出的能力，以及混合推理模型的優勢嗎？跑分追上頂級閉源模型，阿里 Qwen3 成色幾何？毫無疑問，Qwen3 系列最大的亮點之一就是通過引入混合推理設計，實現了同一模型的「思考模式」與「非思考模式」，阿里這次是把這兩種「腦回路」都塞進了同一個模型裏，還開放給用户和開發者自由選擇。非思考模式下，Qwen3 系列會充分發揮快速響應的優勢，更像傳統語言模型的輸出方式——快速直接地生成結果。而在思考模式下，模型則會進行深入地思考和推理，比如比如先分解問題、做一步步的邏輯推導，再得出結論。圖/雷科技這種架構並不是第一次被提出，但 Qwen3 系列是國內首個真正落地混合推理並完全開源的模型。在全球範圍內，除了首先採用這種設計 Claude-3.7-Sonnet，也只有 Google 在 4 月中旬才推出的 Gemini 2.5 Flash 上做出了類似嘗試，包括 OpenAI 儘管早早表明了「混合推理」的目標，但仍在開發中。不僅如此，Qwen3 系列還是一個多尺寸的系列模型，覆蓋包括 0.6B、1.7B、4B、8B、14B、32B，一共 6 個尺寸的稠密模型，以及 Qwen3-30B-A3B 和 Qwen3-235B-A22B 共 2 個適用於複雜任務的 MoE 混合專家模型，並且全部支持 119 種語言和方言。Qwen3 不只是架構上「動了腦子」，性能表現也確實有料。阿里宣稱，小模型如 Qwen3-4B 的性能已可媲美上一代的 Qwen2.5-72B-Instruct，同時 MoE 模型更是在基準測試上表現出了媲美頂尖閉源模型的能力。圖/阿里尤其是參數規模達到 2350 萬億的 Qwen3-235B-A22B，在數學推理基準 AIME25 上，得分達到 81.5，刷新開源模型紀錄；在代碼能力測試 LiveCodeBench 中得分超過 70，超過 Grok-3；在人類偏好評估 ArenaHard 中，得分 95.6，超過 OpenAI o1 和 DeepSeek-R1。這些進步，在一定程度上也解釋了為何 Qwen3 系列一經發布就受到社區熱烈歡迎。另一方面，Qwen3 團隊還強調了 Agent 能力的增強以及對 MCP 的支持，算是順理成章，但目前還沒有看出亮眼的地方。主要可能還是，AI 開發者打造 Agent 的好選擇又多了一個。不過 Qwen3 系列當然還談不上十全十美。在實際推理表現上，Qwen3-235B-A22B 距離今天的頂級模型還有明顯的差異，實測即便在滿血狀態下，遇到困難問題還是容易陷入「冗長而無用」的推理中，最後的結果也不理想。比如雷科技在 OpenAI-o3 上手測試中提出的問題，o3 可以條理清晰地回答「父親崩潰的原因」，但 Qwen3-235B-A22B 則遇到了和 DeepSeek-R1 類似的問題——思考太久且不斷重複方向，甚至沒有抓住「女兒是色盲」這一關鍵的可能性。圖/雷科技包括在 Hacker News 上，也有網友指出 Qwen3-235B-A22B 面對複雜問題時的表現。圖/ Hacker News不過降低一點難度，在經典過河問題上稍作改造來提問 Qwen3-235B-A22B，詢問怎麼把捲心菜、山羊、狼和獅子完整拉過河。儘管採用了窮舉的方式，但還是找到了安全的路徑，關鍵是對規則的理解非常到位。當然，時間有限我們暫時只是簡單地上手，但也大體能看出 Qwen3 最強版本的「成色」，如果從基準測試的分數來看，最好還是放低一下期待。但放到今天的大模型戰場來看，Qwen3 系列依然稱得上最強開源模型，並且混合推理的設計也給用户和開發者帶來了更靈活的選擇。放大鏡下的 Qwen3，阿里的一次關鍵補強放在更大的時間尺度上來看，Qwen3 系列的發布，並不僅僅是一次模型升級這麼簡單，而是可以看作阿里在 AI 戰略上的一次重要補強。過去兩年裏，阿里在大模型領域的佈局其實並不算慢，通義千問體系逐步完善，開源也走得比較早。但無論是在模型的全球聲量，還是在開源社區的話語權上，始終未能真正站到最前排。在 4 月爆料 Qwen3 即將發布（雖然發布時間推遲了）的報道中，虎嗅還指出，基礎模型團隊在阿里內部最重要的考核維度是「模型影響力」，高層希望可以在業內成功塑造「最強模型」的心智。想複製 DeepSeek 的影響力，很難。圖/ X不過 OpenAI、DeepSeek、Google 以及 Anthropic 等公司接連發布的強力模型，阿里此前更多是追隨者角色，很難形成技術引領的姿態。Qwen3 系列的推出，無疑是一場重要的補強，也在某種程度上緩解了這種局面。尤其是在開源模型領域，Qwen3 覆蓋了從小參數到大參數、稠密模型到混合專家模型的一整套體系，支持 119 種語言和方言，同時在 Hugging Face、GitHub 等開發者社區迅速獲得了不錯的反響。這不僅擴展了阿里在開源生態中的存在感，也為更多模型應用、工具鏈建設打下了基礎。而從商業化的角度來看，Qwen3 系列也直接回應了當前模型商業應用的兩大痛點：推理成本高，以及靈活適配性不足。通過引入 MoE 架構大幅降低推理成本，同時又在推理機制上支持思考與非思考的靈活切換，Qwen3 在推理效率、推理成本之間嘗試找到相對平衡的位置。對於阿里雲現有的 AI 服務體系，尤其是政企、製造、金融等行業客户來説，更低的部署門檻和更高的適配靈活性，無疑可以增強阿里在大模型商業化競爭中的籌碼。更重要的是，大模型能力註定是未來 AI 雲競爭的「勝負手」。圖/阿里但如果回到更理性的位置來看，Qwen3 系列仍然存在着一些明顯的不足。正如前文所述，它目前仍然是一個純文本語言模型，多模態乃至 QvQ-Max 上的視覺推理能力都尚未同步整合進來。簡言之，真比最強的模型能力，Qwen3 還有不少需要改進和補足的空間。另一方面，儘管 Qwen3 系列在推理機制上實現了創新，但在真正複雜推理問題中的穩定性和魯棒性，相比 OpenAI、Anthropic 等頂級閉源模型，依然有不小差距。尤其在需要長鏈條邏輯推理、多輪嚴密推導的任務上，Qwen3 的「思考」模式表現出一定的不穩定性，偶爾出現的推理偏移、冗長不聚焦的問題，也説明了目前的混合推理設計還有打磨的餘地。總而言之，在這個大模型競爭白熱化的 4 月，Qwen3 的推出確實為阿里帶來了一次必要且及時的升級。它不僅在性能上與頂尖模型縮小了差距，也在推理機制上探索了新的可能性，同時還有潛力幫助阿里在 AI 的商業化方向補上短板。可見的是，大模型的競爭還會繼續加劇，性能和成本依舊會是兩條重要「主線」，阿里能否繼續保持節奏，甚至在可以預見的「智能體爆發」中佔據主動，仍然需要更多技術演進和產品落地來檢驗。不過至少在今天，Qwen3 確實讓阿里不容忽視。小雷建了幾個粉絲羣，歡迎掃碼加入！大傢伙一塊聊聊天，分享玩機技巧～End","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}