全国政协委员、知乎创始人兼CEO周源:加快建立互联网专业内容的有序流通与合规使用机制

证券日报
Mar 03

  “算力、模型和数据是AI发展的三大基础要素。近年来,国家在算力基础设施建设和模型技术突破方面投入显著,全国一体化算力网络布局加快,国产大模型能力持续提升,为产业发展奠定了坚实基础。”3月3日,全国政协委员、知乎创始人兼CEO周源在接受《证券日报》记者采访时表示。

  与此同时,我国数据要素市场建设也取得积极进展,相关政策文件陆续出台,数据交易平台建设稳步推进。但作为三大基础要素的核心支撑之一,数据要素在制度设计与市场机制层面的完善速度尚需进一步跟上算力与模型的快速迭代步伐,供给与流通体系仍有待深化构建,以实现三者在更高水平上的协同发展。

  周源在调研中发现,当前我国数据建设多集中于政务数据和公共数据集,而互联网空间中长期沉淀的高质量专业内容尚未得到应有重视。现实中,科技、医疗、法律、财经等领域的专业内容社区,汇聚了大量由专家、从业者持续生产的知识型内容,具有专业性强、语义丰富、实践密集等特点,是大模型理解复杂问题、支撑高质量决策的关键数据来源。

  周源认为,建议加快建立互联网专业内容的有序流通与合规使用机制,提高我国AI产业的长期竞争力。

  针对上述问题,周源提出三点系统性的建议。

  一是推动互联网内容社区通过标准API接口向大模型开放数据服务。

  他表示,通过“接口授权、按量计费、来源追溯”的机制,可以确立合规供给新范式,保障原创权益,帮助模型厂商规避侵权风险;依托API内置站点白名单与风控能力,从源头管控数据权威性,确保AIGC内容安全;实时数据接口可使模型动态获取最新信息,解决知识过时与事实错误问题,加速垂直行业模型迭代;构建“平台供数—模型用数—合规变现”的良性生态,降低全行业合规成本,提升国内大模型的国际竞争力。

  二是将高质量“专家数据标注”纳入AI产业链核心组成部分,鼓励内容社区与数据服务商向“智力密集型”转型。

  其中包括:支持内容社区发挥人才聚集优势,提供专家级标注与内容评估服务;开展“专家数据资产化”试点,在研发投入、人才补贴等方面给予政策倾斜;培育中国的“智力资源服务商”,构建“平台供数—专家标数—模型用数”的良性闭环,为国产大模型跨越式发展提供长期智力支撑。

  三是支持互联网内容平台参与建设重点领域专业语料库开源开放平台。

  他建议,在行业主管部门指导下,支持互联网内容社区联合行业协会与科研机构,共建面向重点领域的专业语料开源开放平台,建立统一的数据标准和分级授权框架,明确来源标识、使用范围与责任边界,实现来源可溯、用途可控、责任可界定;探索“公益开放+合规授权”的分层流通模式,兼顾公共利益与创作者权益,形成合理的收益分配机制;同时构建多方参与的质量反馈与持续更新机制,鼓励社区用户参与标注、校对与评价,形成“社区生产—平台治理—模型反馈—持续优化”的良性循环,推动互联网内容社区沉淀的专业知识资源转化为合规、稳定、可持续的大模型训练数据来源,夯实我国AI产业发展的数据基础。

(文章来源:证券日报)

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10