英偉達發佈Rubin CPX,瞄準超長上下文推理,黃仁勳稱一次性推理數百萬token

華爾街見聞
09/09

美東時間9月9日週二,英偉達發佈新一代Rubin CPX芯片系統,專門針對AI視頻生成和軟件開發等大規模上下文處理任務。該產品將於2026年底推出,採用卡片形式,可集成到現有服務器設計中或作爲獨立計算設備在數據中心運行。

這款芯片系統在技術規格上實現重大突破。Rubin CPX GPU提供30千萬億次浮點(flops)運算能力(NVFP4精度),配備128GB GDDR7內存,並集成硬件視頻解碼和編碼功能。完整的Vera Rubin NVL144 CPX平臺在單個機架中集成144個Rubin CPX GPU、144個Rubin GPU和36個Vera CPU,提供8 exaflops AI性能,比GB300 NVL72系統高出7.5倍。

英偉達CEO黃仁勳表示,Rubin CPX是首款專爲百萬級令牌處理而構建的CUDA GPU。他說:

"正如RTX革命性地改變了圖形和物理AI,Rubin CPX是首款專爲大規模上下文AI而構建的CUDA GPU,模型可以同時進行數百萬個知識token的推理。"

英偉達宣稱,部署價值1億美元的新芯片硬件將爲客戶帶來50億美元收入,投資回報率達到30至50倍。該預測強調了英偉達對AI基礎設施商業價值的量化努力。

技術創新:分離式推理架構提升效率

Rubin CPX採用分離式推理架構,將AI計算過程分爲上下文階段和生成階段。上下文階段需要高吞吐量計算來處理大量輸入數據,而生成階段則依賴快速內存傳輸和高速互連。

這種設計允許兩個階段獨立處理,實現計算和內存資源的精準優化。Rubin CPX專門針對計算密集型的上下文階段進行優化,與現有基礎設施協同工作,提供3倍的注意力加速性能。

該平臺配備100TB高速內存和每秒1.7千萬億字節的內存帶寬,通過英偉達Quantum-X800 InfiniBand或Spectrum-X以太網連接,由Dynamo平臺統一協調。

應用場景:重塑軟件開發和視頻生成

在軟件開發領域,Rubin CPX使AI系統能夠處理整個代碼庫,維護跨文件依賴關係,理解倉庫級結構。這將編程助手從自動完成工具轉變爲智能協作夥伴,能夠理解"大規模軟件項目"。

視頻生成方面,該系統可在單個芯片上完成解碼、編碼和處理,AI模型能夠處理多達100萬個token的一小時內容。這爲長視頻內容生成提供了前所未有的連貫性和記憶能力。

多家公司已表達合作意向。代碼生成公司Cursor計劃使用該技術進行代碼生成,視頻創作平臺Runway將其應用於視頻生成工作流程,AI研究公司Magic則計劃利用該技術構建具有1億令牌上下文窗口的基礎模型。

市場影響:鞏固英偉達AI基礎設施優勢

Rubin CPX的發佈進一步鞏固了英偉達在AI基礎設施領域的領先地位。據分析師估計,英偉達數據中心業務本財年收入有望達到1840億美元,超過行業內任何其他公司的總收入。

該產品體現了英偉達在硬件和軟件創新方面的持續投入,這種速度是競爭對手尚未匹及的。通過專門針對特定AI工作負載優化硬件,英偉達繼續保持行業對其產品的依賴。

新平臺預計將爲企業構建下一代生成式AI應用創造新的可能性,特別是在需要處理大規模上下文的高價值推理用例中。這標誌着AI基礎設施從通用計算向專用優化的重要轉變。風險提示及免責條款市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10