DeepSeek V4下周登場,美股再次顫抖!「跳過」英偉達,便宜50倍

科技全掌控
03/01

編輯:犀牛

【新智元導讀】DeepSeek V4下周登場:原生多模態,繞過英偉達,針對國產芯片深度優化。華爾街最怕的那條邏輯可能又要重演:算力霸權鬆動,美股先顫抖。

朋友們,見證歷史的時刻又要到了!

《金融時報》報道,DeepSeek V4,下周正式登場!

距離上一次DeepSeek發布重大模型R1,已經過去了整整一年多。

這一年裏,AI行業風起雲湧,OpenAI連推數代GPT,Anthropic的Claude殺入頂級陣營,谷歌Gemini瘋狂迭代。

整個硅谷都在用數百億美元甚至數千億美元瘋狂「燒錢」。

而DeepSeek呢?

它安安靜靜地待在杭州,沒有發布會,不路演,不炒作。

只做一件事:磨刀。

預計下周發布的V4將是一款支持圖片、視頻和文本生成的原生多模態大模型

更炸裂的是,V4並沒有選擇跟英偉達做優化適配,而是優先與國產芯片廠商合作,針對國產AI芯片進行了深度調優。

這意味着,DeepSeek V4將不只是一次模型升級,也是一次底層架構的戰略轉向。

是中國AI從「用別人的芯片跑自己的模型」走向「用自己的芯片跑自己的模型」的歷史性一步。

DeepSeek選擇國內重磅會議前夕發布V4,無疑發出了一個信號:中國AI,不只是在追趕,還在定義新的遊戲規則。

網友稱,「V4 將對 OpenAI 和 Google 形成巨大壓力。中國沒有放緩,而是在加速。」

「人工智能競賽又提升了一個檔次。」

有網友爆料,DeepSeek V4的API成本將比對手便宜50多倍。

更有網友豪言,美股已經瑟瑟發抖。

V4強在哪?

第一個關鍵詞:多模態。

過去的DeepSeek模型主要是「文字選手」——寫代碼一流,做推理一絕,但圖像和視頻能力一直是短板。

V4徹底補齊了這塊拼圖。

據目前泄露的信息,V4是一個原生多模態模型,能夠同時理解和生成圖片、視頻和文本。

而且,V4 Lite已經在至少一家推理服務商處進行內測,據稱擁有高達100萬token的上下文窗口,表現遠超網頁版和應用版模型。

目前已經在外網瘋傳的一張對比圖顯示,DeepSeek V4 Lite(代號「Sealion-lite」)在不開啓思考模式的情況下,生成的SVG圖像質量已經明顯超越了當前的DeepSeek V3.2思考模型。

有大V發帖稱,V4的編碼性能甚至比當前的GPT和Claude更強。

第二個關鍵詞:國產芯片適配。

這是V4最具戰略意義的突破。

據路透社和《金融時報》報道,DeepSeek這次繞開了英偉達,沒有向這家美國芯片巨頭提供V4的早期接入權限。

這打破了AI行業長期以來的慣例——過去,任何一個頂級大模型發布前,都會先跟英偉達做性能優化。

這一次,DeepSeek選擇了「反向操作」。

DeepSeek用V4告訴全世界:我們不挑芯片,也能跑出世界一流的模型。

當然,客觀地說,英偉達在訓練階段的芯片上依然佔據主導地位,尤其是在計算密集型的預訓練環節。

但在推理階段,V4可能已經實現了國產芯片的全面適配。

推理環節是大模型商業化落地最核心的一環,這一步的突破意義不可估量。

第三個關鍵詞:開源。

據知情人士透露,DeepSeek將在V4發布時同步放出一份簡短的技術說明,並在大約一個月後發布一份更全面的技術報告。

這延續了DeepSeek一貫的「開放精神」。

去年R1發布時附帶的那份詳盡技術報告,曾讓全球AI研究者受益匪淺,被視為推理模型領域最重要的開源貢獻之一。

回顧R1

那一天,硅谷真的慌了

要理解V4的分量,必須先回看去年DeepSeek R1發布時的那場「地震」。

2025年1月20日,DeepSeek悄然上線了R1推理模型。

沒有發布會,沒有媒體吹風會,沒有CEO站在台上揮手致意——就是簡簡單單地把模型放了出來,附帶一份技術報告。

然後,全世界炸了。

R1在多項基準測試上達到了與OpenAI最強模型o1相當甚至超越的水平,而DeepSeek聲稱其訓練成本僅為約560萬美元——這個數字不到GPT-4訓練成本的十分之一。

更要命的是,R1是開源的!

2025年1月27日——這是一個將被載入AI史冊的日子,DeepSeek的手機App超越ChatGPT,成為蘋果App Store下載量第一的免費應用。

同一天,英偉達股價暴跌近17%,單日市值蒸發約5890億美元,創下美國股市單家公司歷史最大單日跌幅紀錄。

博通下跌超過17%,微軟下跌2.1%,整個納斯達克血流成河。

知名風投家馬克·安德森稱DeepSeek為「我見過的最令人驚歎和印象深刻的突破之一」。

多位美國科技界人士將其比作「斯普特尼克時刻」——1957年蘇聯先於美國將衛星送入太空的那一刻,象徵着中國AI實力的強勢崛起。

而華爾街投資人最恐懼的問題浮出水面:如果一家中國公司用十分之一的成本就能做出同等水平的模型,那美國科技巨頭每年砸下的數百億美元基礎設施投資,還值得嗎?

英偉達的高端GPU還會有那麼大的需求嗎?

蟄伏一年,DeepSeek都幹了什麼?

R1之後,DeepSeek進入了長達一年多的「靜默模式」。

沒有新的旗艦模型,只有漸進式更新。

但這並不意味着他們無所作為——恰恰相反,DeepSeek一直在為V4鋪路。

來看看這份更新時間線:

2025年3月:DeepSeek-V3-0324發布。這是V3的一次重要升級,通過吸收R1的強化學習技術改進了後訓練流程,在數學和編程評測上甚至超過了GPT-4.5。

2025年5月:DeepSeek-R1-0528發布。R1的大幅升級版,推理能力顯著增強,代碼生成質量提升,被認為是開源推理模型的新標杆。

2025年8月:DeepSeek-V3.1發布。這是一個里程碑式的更新——V3.1首次將V3和R1的能力融合到一個模型中,支持「思考模式」和「非思考模式」的自由切換,在SWE-bench等基準上比前代提升超40%。此後更新至V3.1-Terminus版本,進一步修復了多語言混合、Agent能力等問題。

2025年9月:DeepSeek-V3.2-Exp發布。引入了全新的稀疏注意力機制(DeepSeek Sparse Attention),為更長上下文和更高效率的推理奠定了架構基礎。

2025年11月:DeepSeekMath V2發布,基於V3.2-Exp-Base構建,在多項數學競賽中達到金牌水平,並驗證了自驗證(self-verification)技術的有效性。

2025年12月:DeepSeek-V3.2正式發布。V3.2-Speciale版本在2025年國際數學奧林匹克(IMO)和國際信息學奧林匹克(IOI)中取得金牌級表現,首次將思考能力整合到工具調用中。

2026年1月:DeepSeek先後發布了關於Manifold-Constrained Hyper-Connections(mHC)和Engram條件記憶技術的研究論文,被業界普遍視為V4的架構基石。mHC改變了信息在模型層間的流動方式,Engram則讓模型能夠選擇性地記憶和調用上下文信息,支持超過100萬token的上下文處理。

每一步,都在為V4的最終亮相做準備。

一場精心策劃的輿論戰?

就在V4即將發布的節骨眼上,美國那邊也沒閒着。

2月24日,Anthropic在X上高調發帖,指控DeepSeek等3家對其Claude模型發動了「工業級蒸餾攻擊」,聲稱這三家中國實驗室創與Claude進行了超過1600萬次對話,以此提取能力來訓練自己的模型。

但諷刺的一幕緊隨其後。

就在Anthropic高調指責「蒸餾」的同一周,網友發現了一個令人瞠目的bug:當你用中文問Claude「你是什麼模型」時,它竟然回覆:「我是DeepSeek V3。」

甚至通過Anthropic官方API測試,結果還是一樣。

用法語提問時,Claude則回答「我是ChatGPT」。

這一幕的戲劇性實在太強了。

你剛指控別人「蒸餾你」,轉頭自己的模型就在中文環境下認了別人當「爹」。

Anthropic那條推文下面6000多條評論,超過70%都在嘲諷。

Reddit上的討論更加一針見血。

有用戶總結道:這是一場有組織的FUD(恐懼、不確定性和懷疑)營銷。

目的很明確——在V4發布前搶佔敘事高地,預先埋下「他們只會作弊抄襲」的框架,無論V4表現多驚豔,公衆的第一反應都會被引導到負面解讀上。

同時通過輿論手段稀釋V4發布的媒體關注度,防止美國科技股再次出現去年R1發布時那樣的兩位數暴跌。

美股再次顫抖?

去年R1發布時,英偉達單日跌去17%,5890億美元灰飛煙滅。

如今V4不僅在模型能力上更進一步(多模態、百萬上下文、原生國產芯片適配),更在戰略層面發出了優先適配國產芯片的明確信號。

如果V4發布後的基準測試再次驗證了DeepSeek的效率優勢——用更少的計算資源達到世界一流水平——那華爾街的投資者勢必要再次面對那個令人不安的問題:AI基礎設施的天量投資,真的有必要嗎?

更值得關注的是,即便是競爭對手陣營的研究人員也在私下承認,DeepSeek V4不可小視。

「可能發布就登頂開源第一」。

DeepSeek V4的發布,不會是一個平靜的事件。

從蠻力到結構

中國AI的進化之路

2023年7月成立,2024年12月發布V3,2025年1月R1震撼全球,一整年持續迭代打磨。

2026年3月V4攜多模態能力與國產芯片適配強勢迴歸。

這條路徑揭示了一個深刻的趨勢:中國AI正在從依賴硬件蠻力走向依靠架構創新和工程效率的道路。

美國的出口管制試圖用「卡脖子」的方式遏制中國AI的發展,但DeepSeek的存在本身就是對這種策略最有力的回應。

當你無法獲得最頂級的芯片時,被迫去思考更聰明的方法——更高效的訓練策略、更精妙的架構設計、更極致的資源優化。

而這些創新一旦形成,價值遠超任何一款芯片。

下周,我們拭目以待。

全世界都在看。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10