独家对话中国联通赵亚晖,AI时代的“数据燃料”是如何炼成的? | 浪潮对话

凤凰网科技
Aug 04

摘要:

高质量数据正成为中国AI产业的差异化优势 。

凤凰网科技《浪潮》出品

作者|Dale

编辑|董雨晴

在2025年WAIC现场中国人工智能产业创新成果展区,中国联通展出了数据产业底座。作为中国通信行业的国家队,中国联通不仅坐拥海量通信数据,更在数据治理、安全流通与行业赋能上走出了一条特色道路。

中国联通软件研究院副院长赵亚晖在此接受了凤凰网科技的专访,介绍了中国联通数据底座的核心能力与产业实践。

一直以来,软件研究院都是中国联通集团总部自主研发的主要力量,在内部也被称为“数字与智能创新中心”。而成长于河南联通的赵亚晖,在2020年正式加入软件研究院任副院长,技术出身的他负责业务、管理和大数据等系统的建设与运营支撑。

炼好AI时代的核心燃料

中国联通此次入选人工智能产业创新成果展正是自主打造的数据产业底座。赵亚晖介绍,入选成果覆盖算力、算法、数据三大能力融合,尤其聚焦于高质量数据集的建设成果,具体包括数据基础设施产品、具备行业特色高质量数据集及场景化应用等。

“中国联通一直非常重视人工智能技术研究与应用,加快推进算、网、数、模、用融合发展”赵亚晖强调,“从底层算网基础设施到数据基础设施,从高质量数据集和大模型应用,都有相应规划布局。”在AI时代,高质量数据集被称为“核心燃料”,是数智融合应用的核心基石。联通作为行业率先实现全国数据集约化的电信运营商,沉淀700PB企业海量数据资源,在此基础上联合行业伙伴共建、共享、共创,形成大规模、多模态、高质量通信领域数据集和行业数据集超过400TB。

同时,面向高质量数据集的研发运营,根据丰富的实践经验总结提炼形成了“三个一”的体系框架,即“一套治理运营方法论、一套平台工具、一套高质量数据集”。

一套数据集治理运营方法论,通过构建数据集分级分类管理框架,建立常态化质量评估与动态优化机制,实现数据集全生命周期的规范化运营。在此过程中,联通还联合国家数字标准委员会、信通院等权威机构参与国家级、行业级标准制定,为高质量数据集的标准化体系建设提供坚实技术支撑。

一套数据集平台工具,打造了覆盖 “数据采集、清洗预处理、标注加工、质量检测、场景应用、效果评估” 的全流程闭环处理链路,形成了自主研发的全流程工具链。该工具链集成了多模态数据智能处理算法、自动化标注引擎及智能质检算子,能实现从原始数据到高质量训练数据的端到端智能化生产,创新成果荣获了首届 DataOps 工具产品创新奖。

一套高质量数据集,围绕大模型训练与数智化应用场景,建成网络运营、客户服务、电信反诈等8个领域的专业化数据集,支撑27个大模型场景的训练与微调。其中,信息通信领域数据集成功入选国务院国资委首批央企高质量数据集优秀建设成果,成为行业内的标杆典范。

“人工智能+走到哪里,高质量数据集就建设到哪里,通过”三个一”体系,不断驱动数据集质量和应用效果的提升。”赵亚晖总结道。这一模式从内部实践出发,逐步延伸到行业数据应用,打通了数据价值落地的关键路径。

高质量数据才是AI时代的差异化优势

随着DeepSeek的出圈,千行百业加速用AI改造现有平台与业务的进程。

但在赵亚晖看来,“要实现AI重塑企业生产经营的各类场景,要对系统应用的体系架构与业务流程进行重构,在实践中我们更深刻的认识到,罗马不是一日建成的,这是一个系统性的智能化改造工程。”

中国联通的策略是从场景切入,特别是聚焦于特定行业。对内增强智慧运营新动能,高效推进数字化细分场景全面融智,聚焦办公管理、市场营销、政企发展等七大领域开展AI转型,构建上千个智能体,覆盖千余项细分场景,累计超万人参与其中。对外拓展行业发展新空间,联合行业合作伙伴构建了装备制造、消费品、原材料、医疗健康等上百个行业智能化应用,赋能千行百业数智化转型。

“比如一线基层晨会筹备场景中,告别手工查报表,语音提问即秒得经营数据,从 "埋头查数" 到 "张口要数",数据报表制作时间从小时级缩短至分钟级。”赵亚晖告诉凤凰网科技。

相比其他行业来说,通信数据更聚焦于实时性、准确性、可靠性等硬指标。这种差异化优势,正成为联通赋能行业的独特基础。目前,中国联通的数据服务已经面向千行百业开放,尤其是前述提及的工业、金融场景。

“面向ToB、ToC客户,最终会发现,大模型的场景要落地、要做好,关键在于数据与大模型场景的结合上。”赵亚晖告诉凤凰网科技,随着国内算力供给能力的不断提升,大模型普惠平权的发展,现阶段,数据集已成为各行各业关注的另一焦点,建好用好高质量数据,有助于企业在AI产业化应用中打造自身的差异化优势。

智能革命背后的安全博弈

数据要素价值的释放和产业发展,离不开数据要素的高效流通。但数据流通是把双刃剑,它在释放价值的同时,也面临着安全与隐私的挑战。联通对此有着深刻的认识,在数据安全方面建立了多重防线。

我们在内部建设了数据分类分级平台、4A 金库等工具,数据使用控制全程上链,严格管控敏感数据访问权限,确保数据流通全过程可管可控。” 赵亚晖介绍道,对外,联通也构建了多重技术防护体系,打造了数据安全态势、安全威胁检测预警等多款技术产品。

在跨域、跨主体数据流通上,联通积极参与国家可信数据空间建设,推动数据 “可用不可见、可控可计量、可管可回溯” 的高效、安全、可信流通。同时充分发挥产学研优势,在隐私计算、数据沙箱、区块链等领域开展前沿性技术探索。“国家在规划布局建设城市、行业、企业可信数据空间,联通也在积极参与国家数据流通基础设施的建设,保障数据要素供的出、流的动、用得好”赵亚晖说,“数据流通过程需要解决的核心问题就是安全问题,同时还要进一步完善数据确权、交易、收益分摊等一系列配套机制,这需要政府、行业、企业共同努力,协同打造全国一体化数据市场。”

从新型数据基础设施的建设到高质量数据集的打造,从内部大模型创新实践到赋能千行百业智能化升级,联通正用创新的技术和实践,在 AI 时代探索着央企特色的数据价值化之路,让 “数据燃料” 持续驱动智能革命向前迈进。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10