DeepSeek更新新模型 可一次性處理超長文本

新浪科技
02/11

  新浪科技訊 2月11日晚間消息,多名用戶反饋,DeepSeek在網頁端和APP端進行了版本更新,支持最高1M(百萬)Token的上下文長度。而去年8月發布的DeepSeekV3.1上下文長度拓展至128K。

  實測中發現,DeepSeek在問答中稱自身支持上下文1M,可以一次性處理超長文本。提交超過24萬個token的《簡愛》小說文檔,DeepSeek可以支持識別文檔內容。

  之前曾有知情人士稱,DeepSeek 春節更可能推出的是針對V3系列模型的小幅更新。但該人士同時透露,真正的重頭戲仍在路上。DeepSeek下一代旗艦模型預計將是一款萬億參數級別的基礎模型,正因規模大幅躍升,訓練速度明顯放緩,導致發布進程有所延後。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:何俊熹

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10