「算力、模型和數據是AI發展的三大基礎要素。近年來,國家在算力基礎設施建設和模型技術突破方面投入顯著,全國一體化算力網絡佈局加快,國產大模型能力持續提升,為產業發展奠定了堅實基礎。」3月3日,全國政協委員、知乎創始人兼CEO周源在接受《證券日報》記者採訪時表示。
與此同時,我國數據要素市場建設也取得積極進展,相關政策文件陸續出台,數據交易平台建設穩步推進。但作為三大基礎要素的核心支撐之一,數據要素在制度設計與市場機制層面的完善速度尚需進一步跟上算力與模型的快速迭代步伐,供給與流通體系仍有待深化構建,以實現三者在更高水平上的協同發展。
周源在調研中發現,當前我國數據建設多集中於政務數據和公共數據集,而互聯網空間中長期沉澱的高質量專業內容尚未得到應有重視。現實中,科技、醫療、法律、財經等領域的專業內容社區,匯聚了大量由專家、從業者持續生產的知識型內容,具有專業性強、語義豐富、實踐密集等特點,是大模型理解複雜問題、支撐高質量決策的關鍵數據來源。
周源認為,建議加快建立互聯網專業內容的有序流通與合規使用機制,提高我國AI產業的長期競爭力。
針對上述問題,周源提出三點系統性的建議。
一是推動互聯網內容社區通過標準API接口向大模型開放數據服務。
他表示,通過「接口授權、按量計費、來源追溯」的機制,可以確立合規供給新範式,保障原創權益,幫助模型廠商規避侵權風險;依託API內置站點白名單與風控能力,從源頭管控數據權威性,確保AIGC內容安全;實時數據接口可使模型動態獲取最新信息,解決知識過時與事實錯誤問題,加速垂直行業模型迭代;構建「平台供數—模型用數—合規變現」的良性生態,降低全行業合規成本,提升國內大模型的國際競爭力。
二是將高質量「專家數據標註」納入AI產業鏈核心組成部分,鼓勵內容社區與數據服務商向「智力密集型」轉型。
其中包括:支持內容社區發揮人才聚集優勢,提供專家級標註與內容評估服務;開展「專家數據資產化」試點,在研發投入、人才補貼等方面給予政策傾斜;培育中國的「智力資源服務商」,構建「平台供數—專家標數—模型用數」的良性閉環,為國產大模型跨越式發展提供長期智力支撐。
三是支持互聯網內容平台參與建設重點領域專業語料庫開源開放平台。
他建議,在行業主管部門指導下,支持互聯網內容社區聯合行業協會與科研機構,共建面向重點領域的專業語料開源開放平台,建立統一的數據標準和分級授權框架,明確來源標識、使用範圍與責任邊界,實現來源可溯、用途可控、責任可界定;探索「公益開放+合規授權」的分層流通模式,兼顧公共利益與創作者權益,形成合理的收益分配機制;同時構建多方參與的質量反饋與持續更新機制,鼓勵社區用戶參與標註、校對與評價,形成「社區生產—平台治理—模型反饋—持續優化」的良性循環,推動互聯網內容社區沉澱的專業知識資源轉化為合規、穩定、可持續的大模型訓練數據來源,夯實我國AI產業發展的數據基礎。
(文章來源:證券日報)