美股研究社訊,天眼查App顯示,5月13日,阿里巴巴(中國)網絡技術有限公司申請的“大語言模型的訓練方法和信息處理方法”專利公佈。
摘要顯示,本申請涉及人工智能技術領域。其中,該方法包括:獲取第一知識信息;將第一知識信息輸入到大語言模型中,以使大語言模型學習第二知識信息,得到學習後的大語言模型;依據第二知識信息,構建訓練樣本集,其中,訓練樣本集至少包括多個知識樣本,以及知識樣本對應的第一答覆信息和第二答覆信息;通過訓練樣本集對學習後的大語言模型進行監督訓練,得到目標大語言模型。本申請解決了相關技術中通過將相關知識輸入到大語言模型中實現對大語言模型的訓練,導致大語言模型答覆準確性比較低的技術問題。