王小川的百川智能發佈全鏈路領域增強金融大模型,準確率超過GPT-4o

鈦媒體
2024-12-23

(圖片來源:鈦媒體AGI編輯林志佳拍攝)

“大模型六虎”加速內卷,百川智能公佈金融垂直領域模型。

12月23日消息,鈦媒體AGI獲悉,王小川創立的通用 AI 公司百川智能今天發佈全鏈路領域增強大模型Baichuan4-Finance。在高質量金融數據的基礎上,通過行業首創自約束訓練方案,Baichuan4-Finance實現金融能力和通用能力,極大提高金融場景整體可用性。其金融專業能力和場景應用能力大幅領先GPT-4o。

百川智能創立於2023年4月10日,由搜狗公司創始人、前CEO王小川創立,旨在打造中國版的OpenAI,構建中國最好的大模型底座,幫助大衆輕鬆、普惠地獲取世界知識和專業服務,並在醫療與行業領域應用落地。截至目前,百川智能已相繼推出16款大模型,涵蓋開源、閉源、學術科研、國產算力等多個維度。

今年10月31日,百川智能宣佈推出包括Baichuan4-Turbo、Baichuan4-Air兩款模型在內的一站式大模型商業化解決方案,即1+3產品矩陣(全鏈路優質通用訓練數據,Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領域增強工具鏈)。

如今,百川智能向金融領域提供全新的大模型產品。

具體來說,中國人民大學財政金融學院12月17日發佈的金融評測體系FLAME以及國內主流開源金融評測基準FinancelQ上,Baichuan4-Finance均登上榜首。其中,FLAME-Cer評測結果顯示,Baichuan4-Finance在銀行、保險、基金、證券等多個資格認證領域的準確率均突破了95%,整體準確率93.62%,大幅領先金融領域公認的綜合實力最強的通用模型之一GPT-4o、國內首個開源中文金融大模型XuanYuan3-70B-Chat,超出GPT-4o近20%。

同時,百川智能打造了一套全鏈路領域增強方案,該方案覆蓋了高質量數據集構建、模型預訓練、微調、強化學習等從模型研發到場景應用的全流程。同時,Baichuan4-Finance還在領域自約束訓練過程中引入了更高精的通用數據,與高質量金融數據一起進行混合訓練,最終實現了模型通用能力不下降,金融能力穩定增長的效果。此外,百川智能在後訓練環節也做了大量增強工作,如:通過合成數據、指令數據對模型進行有監督的微調;在強化學習策略中,針對數學計算等金融領域特別關注的場景進行樣本增強等,進一步提升了模型性能。

商業化層面,目前,百川智能已經服務了數千家客戶,包括北電數智、完美世界遊戲、愛奇藝、360集團、生學教育、愛學堂等各行業的領軍企業,並且與信雅達、用友、軟通動力新致軟件、達觀數據、華勝天成等多家行業生態夥伴,以及華爲、中科曙光等硬件廠商,中國移動中國電信中國聯通等運營商達成合作,攜手構建百川大模型生態。

用友表示,Baichuan4-Finance憑藉其海量的金融專業知識儲備,在財稅知識問答場景中,準確率較Baichuan4-Turbo提升了20%,較GPT-4o提升了10%,表現尤爲亮眼;軟通動力表示,自部署Baichuan4-Finance以來,其客戶滿意度提升了20%。

事實上,百川智能已經轉向行業模型領域。百川智能創始人、CEO王小川早前表示,AGI 正在產生巨大的突破,但目前百川沒有達到世界級的水平,只是有一定成績,對自己來講有 60 分吧。主要今天在現實和理解中得找到自己的一條道路,百川認爲自己已經打明牌了,有實踐的路徑。

“定義什麼是 AGI,其實有很多行業討論,大家不斷在上面加碼。之前我們討論‘機器怎麼纔算有智能?’以前是圖靈測試,對話者分辨不出來是人還是機器,這就算智能了。到了今天,機器還要會解數學題,還要有主動學習的能力。我理解 AGI 是做到“像人一樣”,像一個數字員工,能夠在多個職業裏產生工作成果。之前和一個技術大佬交流,他質疑當下的大模型,他說大模型七位數乘法都做不好。我反問‘你會嗎?你拿着科技公司的股份,你也不會七位數的乘法,你爲什麼要求 AGI 會?’這是個審美問題,我們以前總是把 AGI 當成一個工具,它是超級計算機,能精確地做計算,或者跑程序跑得很快。但 AGI 本身,我覺得就像人一樣,如果審美沒有建立好,你怎麼去評價它呢。AGI 正在產生巨大的突破,它的文章已經寫得像最頂尖的文科生了,還可以寫詩,隨着 OpenAI o1 的推出,AI 有了更好的邏輯推理能力,文理雙修。但它並不是上帝,它像一個極其聰明的人,但它現在真的知道宇宙規律嗎?”王小川表示,AGI 現在還在飛速發展中。往後還有新的突破,發展速度並沒有變慢。大家都過高期待這兩年的速度,也許三五年後,就會非常不一樣。而今天我們從互聯網時代走入到了 AI 時代,他感覺很幸運,沒有錯過每一個時代。

對於 AI 搜索,王小川表示,雖然這能走出百度射程,甚至能夠顛覆百度,但它依然在字節產品的射程裏。“從競爭角度,在大廠的 DAU(日活躍用戶)範疇內,我們還是處於弱勢地位,在很多地方也搞不過小公司,他們對於需求敏感度的把握,會把腰部公司撕的粉碎,他們有很強的競爭力。反過來,醫療領域大家都認爲是垂類,小公司不一定做的動,雖然上一代已經投了 1000 億進去,投資人很多都失去信心了,但投資還在持續加大。”

王小川強調,醫療絕不只是垂直方向,它不僅與 AGI 是等價的,還代表着生命科學的未來想象。

“我們從今天的智能時代走向生命時代,可能會越走越廣闊,醫療是當下特別好的,獨有的一個卡位,但我相信在三年、五年後,大家會看到它不是個垂直方向,它可能代表更廣闊的未來。”王小川稱。

(作者|林志佳,編輯|胡潤峯)

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10