騰訊雲登上國際BIRD榜單前三,刷新國內NL2SQL最佳成績

市場資訊
07/04

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

國產Agent進入“NL2SQL全球最難榜單”前三。

7月4日,據國際權威評測基準BIRD-Bench官網消息,騰訊雲自研的數據分析智能體TCDataAgent斬獲全球第三的成績,超越IBM、Meta等衆多國際廠商,同時也是目前國內在該榜單上排名最高的排名。

來源:BIRD-Bench官網

BIRD-Bench以其嚴苛性被譽爲“NL2SQL全球最難榜單”。它不僅要求系統將自然語言問題(如“找出未通過質檢的訂單”)準確翻譯成SQL語句,更要求生成的SQL在真實、龐大且含“髒數據”的企業級數據庫上執行結果精準且運行高效,對模型的深層語義理解和數據庫真實內容感知能力提出了極高挑戰。

在這個以真實業務數據庫爲基礎的測試中,覆蓋金融、醫療、體育等37個行業場景,數據庫總容量達33GB,查詢問題超過1萬條。TCDataAgent在官方不公開數據集的封閉測試環境下,最終獲得了75.74分,位居全球第三, 國內第一。

相比於傳統NL2SQL方案往往只能依賴有限信息“猜測”用戶意圖,易因數據結構複雜或語義模糊出錯。TCDataAgent登榜的技術創新來源於引入了數據庫約束驗證機制,能夠自動識別並修正SQL中潛在的結構性或語義性錯誤(如錯誤連接、冗餘條件)。

更重要的是,它緊密結合數據庫的真實內容對生成的SQL進行優化,顯著提升了用戶意圖識別的準確率和翻譯結果的可靠性。值得一提的是,TCDataAgent還引入了後訓練(post-training)技術,通過優先篩選並複用效果最優的SQL樣本進行模型迭代訓練,有效提升了訓練樣本的質量和模型學習的穩定性。

騰訊雲TCDataAgent在NL2SQL領域的技術研究成果也獲得了國際學術界的認可,相關論文已被今年的數據庫領域頂級國際會議VLDB接收。論文中的實驗表明,TCDataAgent的“數據庫內容感知”核心技術模塊,可以無縫集成到其他NL2SQL系統中,最高能將查詢執行準確率提升18.3%,並在多個主流方法上實現了超過5%的性能提升。

作爲騰訊雲新一代企業級智能分析Agent,TCDataAgent致力於讓用戶直接使用自然語言對結構化和非結構化數據進行復雜的數據查詢、報表生成和趨勢分析等任務,目前已開啓內測。

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10