科技媒體marktechpost報道,英偉達近日推出專為文檔理解任務優化的視覺-語言模型Llama Nemotron Nano VL。該模型基於Llama 3.1架構,融合CRadioV2-H視覺編碼器和Llama 3.1 8B語言模型,支持多頁文檔的視覺與文本分析,上下文長度達16K。
網頁鏈接科技媒體marktechpost報道,英偉達近日推出專為文檔理解任務優化的視覺-語言模型Llama Nemotron Nano VL。該模型基於Llama 3.1架構,融合CRadioV2-H視覺編碼器和Llama 3.1 8B語言模型,支持多頁文檔的視覺與文本分析,上下文長度達16K。
網頁鏈接免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。