AI摘要:4月28日,在第九屆數字中國建設峰會“數字福建”分論壇上,張向宏稱規模化構建高質量數據集是釋放數據價值的關鍵,提出“數據工廠”新型生產業態,建議國家或區域層面部署數據工廠應與數據基礎設施緊密結合,形成體系化支撐。
(AI摘要及本文部分素材由福建省智能媒體資源庫省級平臺提供“智媒+”支持,福建報業集團智能審校平臺提供審校技術支持)
海峽網訊(記者 王挺)在4月28日舉行的第九屆數字中國建設峰會“數字福建”分論壇上,北京交通大學信息管理與技術國際研究中心教授張向宏發表了題為《建設“數據工廠”,推動數據價值釋放》的主旨演講。

張向宏發表主旨演講。海峽網記者 王挺 攝
他指出,面向人工智能的數據產業鏈已經初步形成,而規模化構建高質量數據集,正是當前數據價值釋放與行業應用落地的關鍵突破口。
張向宏回顧,自國家數據局成立以來,已在數據確權、流通、交易等方面形成了一套行之有效的工具箱和方法論。然而,數據資源的開發利用卻長期缺乏像云計算那樣成熟的商業化模式。“經過一年多的研究,我們發現,這個瓶頸正在被打破。”張向宏表示,數據要素化的最終出口已經明確,那就是人工智能在千行百業的應用。一條由“原始數據——基礎大模型——高質量數據集——智能體與垂直模型——行業應用”構成的產業鏈閉環,正成為主流的商業化實踐路徑。
盡管基礎大模型技術迭代迅速,但張向宏認為,當前人工智能的應用多停留在“玩”的階段,距離個人生活、企業經營和政府服務的深度賦能仍有巨大差距。究其根源,在于缺乏高能量的、經過精細化處理的高質量數據集。“到了基礎大模型微調和對齊的階段,人工智能的前進腳步就停下了,因為讓模型能真正‘扣準、答對’的那批少量但精準的專有數據,太稀缺了。”
對此,張向宏提出了“數據工廠”這一新型生產業態。他將數據工廠類比為農業社會的農場、工業社會的工廠,是數字時代規模化生產“高能量數據”的核心載體,也是國家數據基礎設施的重要組成部分。其內部形態包含集中式、半集中式和分布式,并具備多樣化、設施化、規模化、標準化和柔性化等特點。
“沒有數據,工廠就是無源之水。”張向宏指出,數據工廠由儲備條件、生產車間和中試條件構成,涵蓋數據清洗、合成、增強、標注、質檢等一系列工藝,最終產出可直接用于垂直大模型對齊和推理的產品。他特別提到,數據標注企業的升級、算力中心向數據工廠的架構轉型、人工智能企業向前端數據生產延伸,以及創新型技術企業的崛起,是當前數據工廠落地的幾種主流模式。
最后,張向宏建議,在國家或區域層面部署數據工廠,應與數據基礎設施緊密結合。在底層建設公共數據工廠,在重要行業建設行業公共數據工廠,并在流通利用設施中布局專屬數據工廠,從而形成體系化支撐。
責任編輯:趙睿
- 魏亮:數據基礎設施建設進入價值共創關鍵階段2026-04-29
- 單志廣:數據要素價值化亟待構建三維空間產權理論2026-04-29
- “模數共振”行動在榕啟動 AI賦能新型工業化邁入新階段2026-04-29
- 一圖帶你搶先看!數字峰會這些亮點不容錯過2026-04-28
- 數字峰會現場體驗區今起開放2026-04-28
- 第九屆數字中國建設峰會“數字福建”分論壇在福州舉行2026-04-28
- 數字峰會即將開幕 交警發布出行攻略2026-04-28
- 數字峰會福州新區(長樂區)分會場準備就緒2026-04-28
- 數字峰會開幕在即,海峽會展中心周邊交通有變!周邊居民、觀展市民必看→2026-04-28
- 乘“數”而上 向“智”而行——寫在第九屆數字中國建設峰會即將舉辦之際2026-04-28
- 最新福州新聞 頻道推薦
-
單志廣:數據要素價值化亟待構建三維空間產權2026-04-29
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞

已有0人發表了評論