獨家對話中國聯通趙亞暉,AI時代的“數據燃料”是如何煉成的? | 浪潮對話

鳳凰網科技
08/04

摘要:

高質量數據正成爲中國AI產業的差異化優勢 。

鳳凰網科技《浪潮》出品

作者|Dale

編輯|董雨晴

在2025年WAIC現場中國人工智能產業創新成果展區,中國聯通展出了數據產業底座。作爲中國通信行業的國家隊,中國聯通不僅坐擁海量通信數據,更在數據治理、安全流通與行業賦能上走出了一條特色道路。

中國聯通軟件研究院副院長趙亞暉在此接受了鳳凰網科技的專訪,介紹了中國聯通數據底座的核心能力與產業實踐。

一直以來,軟件研究院都是中國聯通集團總部自主研發的主要力量,在內部也被稱爲“數字與智能創新中心”。而成長於河南聯通的趙亞暉,在2020年正式加入軟件研究院任副院長,技術出身的他負責業務、管理和大數據等系統的建設與運營支撐。

煉好AI時代的核心燃料

中國聯通此次入選人工智能產業創新成果展正是自主打造的數據產業底座。趙亞暉介紹,入選成果覆蓋算力、算法、數據三大能力融合,尤其聚焦於高質量數據集的建設成果,具體包括數據基礎設施產品、具備行業特色高質量數據集及場景化應用等。

“中國聯通一直非常重視人工智能技術研究與應用,加快推進算、網、數、模、用融合發展”趙亞暉強調,“從底層算網基礎設施到數據基礎設施,從高質量數據集和大模型應用,都有相應規劃佈局。”在AI時代,高質量數據集被稱爲“核心燃料”,是數智融合應用的核心基石。聯通作爲行業率先實現全國數據集約化的電信運營商,沉澱700PB企業海量數據資源,在此基礎上聯合行業夥伴共建、共享、共創,形成大規模、多模態、高質量通信領域數據集和行業數據集超過400TB。

同時,面向高質量數據集的研發運營,根據豐富的實踐經驗總結提煉形成了“三個一”的體系框架,即“一套治理運營方法論、一套平臺工具、一套高質量數據集”。

一套數據集治理運營方法論,通過構建數據集分級分類管理框架,建立常態化質量評估與動態優化機制,實現數據集全生命週期的規範化運營。在此過程中,聯通還聯合國家數字標準委員會、信通院等權威機構參與國家級、行業級標準制定,爲高質量數據集的標準化體系建設提供堅實技術支撐。

一套數據集平臺工具,打造了覆蓋 “數據採集、清洗預處理、標註加工、質量檢測、場景應用、效果評估” 的全流程閉環處理鏈路,形成了自主研發的全流程工具鏈。該工具鏈集成了多模態數據智能處理算法、自動化標註引擎及智能質檢算子,能實現從原始數據到高質量訓練數據的端到端智能化生產,創新成果榮獲了首屆 DataOps 工具產品創新獎。

一套高質量數據集,圍繞大模型訓練與數智化應用場景,建成網絡運營、客戶服務、電信反詐等8個領域的專業化數據集,支撐27個大模型場景的訓練與微調。其中,信息通信領域數據集成功入選國務院國資委首批央企高質量數據集優秀建設成果,成爲行業內的標杆典範。

“人工智能+走到哪裏,高質量數據集就建設到哪裏,通過”三個一”體系,不斷驅動數據集質量和應用效果的提升。”趙亞暉總結道。這一模式從內部實踐出發,逐步延伸到行業數據應用,打通了數據價值落地的關鍵路徑。

高質量數據纔是AI時代的差異化優勢

隨着DeepSeek的出圈,千行百業加速用AI改造現有平臺與業務的進程。

但在趙亞暉看來,“要實現AI重塑企業生產經營的各類場景,要對系統應用的體系架構與業務流程進行重構,在實踐中我們更深刻的認識到,羅馬不是一日建成的,這是一個系統性的智能化改造工程。”

中國聯通的策略是從場景切入,特別是聚焦於特定行業。對內增強智慧運營新動能,高效推進數字化細分場景全面融智,聚焦辦公管理、市場營銷、政企發展等七大領域開展AI轉型,構建上千個智能體,覆蓋千餘項細分場景,累計超萬人參與其中。對外拓展行業發展新空間,聯合行業合作伙伴構建了裝備製造、消費品、原材料、醫療健康等上百個行業智能化應用,賦能千行百業數智化轉型。

“比如一線基層晨會籌備場景中,告別手工查報表,語音提問即秒得經營數據,從 "埋頭查數" 到 "張口要數",數據報表製作時間從小時級縮短至分鐘級。”趙亞暉告訴鳳凰網科技。

相比其他行業來說,通信數據更聚焦於實時性、準確性、可靠性等硬指標。這種差異化優勢,正成爲聯通賦能行業的獨特基礎。目前,中國聯通的數據服務已經面向千行百業開放,尤其是前述提及的工業、金融場景。

“面向ToB、ToC客戶,最終會發現,大模型的場景要落地、要做好,關鍵在於數據與大模型場景的結合上。”趙亞暉告訴鳳凰網科技,隨着國內算力供給能力的不斷提升,大模型普惠平權的發展,現階段,數據集已成爲各行各業關注的另一焦點,建好用好高質量數據,有助於企業在AI產業化應用中打造自身的差異化優勢。

智能革命背後的安全博弈

數據要素價值的釋放和產業發展,離不開數據要素的高效流通。但數據流通是把雙刃劍,它在釋放價值的同時,也面臨着安全與隱私的挑戰。聯通對此有着深刻的認識,在數據安全方面建立了多重防線。

我們在內部建設了數據分類分級平臺、4A 金庫等工具,數據使用控制全程上鍊,嚴格管控敏感數據訪問權限,確保數據流通全過程可管可控。” 趙亞暉介紹道,對外,聯通也構建了多重技術防護體系,打造了數據安全態勢、安全威脅檢測預警等多款技術產品。

在跨域、跨主體數據流通上,聯通積極參與國家可信數據空間建設,推動數據 “可用不可見、可控可計量、可管可回溯” 的高效、安全、可信流通。同時充分發揮產學研優勢,在隱私計算、數據沙箱、區塊鏈等領域開展前沿性技術探索。“國家在規劃佈局建設城市、行業、企業可信數據空間,聯通也在積極參與國家數據流通基礎設施的建設,保障數據要素供的出、流的動、用得好”趙亞暉說,“數據流通過程需要解決的核心問題就是安全問題,同時還要進一步完善數據確權、交易、收益分攤等一系列配套機制,這需要政府、行業、企業共同努力,協同打造全國一體化數據市場。”

從新型數據基礎設施的建設到高質量數據集的打造,從內部大模型創新實踐到賦能千行百業智能化升級,聯通正用創新的技術和實踐,在 AI 時代探索着央企特色的數據價值化之路,讓 “數據燃料” 持續驅動智能革命向前邁進。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10