1月13日,英國首相斯塔默宣布“人工智能機(jī)遇行動(dòng)計(jì)劃”,其中提到創(chuàng)建國家數(shù)據(jù)圖書館以安全可靠地釋放公共數(shù)據(jù)的價(jià)值,支持人工智能的發(fā)展。近期,英國托尼·布萊爾全球變革研究所發(fā)布《Governing in the Age of AI》報(bào)告,提出建立國家數(shù)據(jù)圖書館,以解決英國現(xiàn)有數(shù)據(jù)基礎(chǔ)設(shè)施落后的問題,消除數(shù)據(jù)訪問的系統(tǒng)性障礙,充分釋放數(shù)據(jù)在驅(qū)動(dòng)AI創(chuàng)新發(fā)展中的潛力。當(dāng)前,英國公共部門數(shù)據(jù)面臨數(shù)據(jù)分散、數(shù)據(jù)訪問成本高、數(shù)據(jù)安全性不足等突出挑戰(zhàn)。為打破這一困境,國家數(shù)據(jù)圖書館被視為英國數(shù)字化轉(zhuǎn)型議程的核心支柱。本文通過分析英國在AI創(chuàng)新發(fā)展中面臨的數(shù)據(jù)難題,及報(bào)告提出的國家數(shù)據(jù)圖書館構(gòu)建路徑,研判全球AI數(shù)據(jù)治理面臨的挑戰(zhàn),并為我國規(guī)避“數(shù)據(jù)孤島”與“治理失靈”提出啟示及建議。
英國在AI創(chuàng)新發(fā)展中面臨三大數(shù)據(jù)難題
1.“數(shù)據(jù)孤島”問題突出,削弱數(shù)據(jù)使用價(jià)值
一是英國政府在部分關(guān)鍵領(lǐng)域已具有一定的數(shù)據(jù)積累,但相關(guān)部門數(shù)據(jù)分散。據(jù)英國政府網(wǎng)站2025年1月發(fā)布的英國數(shù)字政府現(xiàn)狀回顧報(bào)告1,英國只有53%的政府部門超過60%的數(shù)據(jù)已上公共云,63%的國家醫(yī)療服務(wù)體系和公共機(jī)構(gòu)中少于40%的數(shù)據(jù)已上公共云。
二是英國政府部門數(shù)字化服務(wù)程度偏低,數(shù)據(jù)采集和訪問的門檻較高。據(jù)英國數(shù)字政府現(xiàn)狀回顧報(bào)告,截至2024年,傳統(tǒng)技術(shù)仍占英國中央政府部門系統(tǒng)的28%,而47%的中央政府和45%的國家醫(yī)療服務(wù)體系尚未建立起有效的數(shù)字化途徑1。
2.投資不足及成本高企,掣肘創(chuàng)新發(fā)展進(jìn)程
對(duì)于現(xiàn)有的數(shù)據(jù)基礎(chǔ)設(shè)施和數(shù)字服務(wù)系統(tǒng)的技術(shù)投資不足,維護(hù)成本高。2023年,英國公共部門在技術(shù)領(lǐng)域投入約260億英鎊,低于行業(yè)基準(zhǔn)約30%。該投資缺口帶來了雙重挑戰(zhàn):一方面,新技術(shù)的研發(fā)和應(yīng)用缺乏足夠資金支持,導(dǎo)致創(chuàng)新動(dòng)力不足;另一方面,現(xiàn)有系統(tǒng)的維護(hù)成本卻在不斷攀升,甚至達(dá)到新替代方案的3至4倍2。
構(gòu)建超大型數(shù)據(jù)庫需較高的成本,托尼·布萊爾全球變革研究所預(yù)測,若政府只優(yōu)先考慮部署10個(gè)高影響的用例,初始成本就可能高達(dá)2億英鎊。且英國政府在技術(shù)領(lǐng)域過度依賴高成本外包,政府在數(shù)字化能力方面存在不足,缺乏足夠的內(nèi)部數(shù)字人才和技術(shù)能力,這將限制政府在數(shù)字改革和創(chuàng)新應(yīng)用方面的自主性和效率。
3.數(shù)據(jù)安全性不足,影響公眾信任
英國對(duì)數(shù)據(jù)安全保障不足,數(shù)據(jù)泄露事件頻發(fā)阻礙推進(jìn)數(shù)據(jù)共享及流通。2024年,英國國家網(wǎng)絡(luò)安全中心報(bào)告的全國重大網(wǎng)絡(luò)安全事件同比增長超50%,事件嚴(yán)重程度提升了3倍。2024年英國國家醫(yī)療服務(wù)體系(NHS)遭遇網(wǎng)絡(luò)攻擊,泄露的數(shù)據(jù)包括2018年到2024年的患者和捐贈(zèng)者的全名、地址、捐贈(zèng)金額、醫(yī)療報(bào)告(包括獨(dú)特的醫(yī)院編號(hào)和出生日期)以及財(cái)務(wù)文件。
國家數(shù)據(jù)圖書館是英國數(shù)字化轉(zhuǎn)型議程的核心支柱
國家數(shù)據(jù)圖書館將是實(shí)現(xiàn)高價(jià)值的數(shù)據(jù)集成,為各部門提供工具、標(biāo)準(zhǔn)和專業(yè)知識(shí),以促進(jìn)安全、負(fù)責(zé)任的數(shù)據(jù)共享及開啟新協(xié)作機(jī)會(huì)的中心。盡管構(gòu)建英國國家數(shù)據(jù)圖書館初期成本高,但回報(bào)潛力巨大。一個(gè)全面開發(fā)的人工智能數(shù)據(jù)生態(tài)系統(tǒng)可能會(huì)帶來20倍的投資回報(bào)。據(jù)DARE UK預(yù)測,2050年更先進(jìn)的數(shù)據(jù)訪問方式將帶來相當(dāng)于每年130億英鎊的經(jīng)濟(jì)效益。通過建立國家數(shù)據(jù)圖書館,可助力英國成為人工智能驅(qū)動(dòng)創(chuàng)新和經(jīng)濟(jì)增長方面的全球領(lǐng)導(dǎo)者,并成為其重新構(gòu)想在全球人工智能治理中戰(zhàn)略位置的實(shí)踐典范。
1.分階段推進(jìn)國家數(shù)據(jù)圖書館建設(shè)
按照《Governing in the Age of AI》的設(shè)想,英國國家數(shù)據(jù)圖書館構(gòu)建可分三階段推進(jìn):即刻行動(dòng)、中期部署和長期規(guī)劃。

1、打破數(shù)據(jù)孤島
采用數(shù)據(jù)聯(lián)邦架構(gòu),各部門對(duì)其數(shù)據(jù)保持控制權(quán),同時(shí)對(duì)敏感數(shù)據(jù)進(jìn)行分散控制。部門間數(shù)據(jù)主權(quán)意識(shí)可能阻礙共享,需通過法律豁免(如數(shù)據(jù)控制者賠償機(jī)制)和政策激勵(lì)(如績效掛鉤資金分配)推動(dòng)協(xié)作。
報(bào)告提出的建議:
o 設(shè)立跨部門協(xié)調(diào)委員會(huì),明確數(shù)據(jù)共享的權(quán)責(zé)邊界與經(jīng)濟(jì)收益分配。
o 建立一個(gè)有明確的部長級(jí)監(jiān)督和跨政府協(xié)調(diào)的高級(jí)領(lǐng)導(dǎo)團(tuán)隊(duì)。
o 以存量數(shù)據(jù)資源為基礎(chǔ),啟動(dòng)核心數(shù)據(jù)池建設(shè),重點(diǎn)打通跨部門數(shù)據(jù)接口。
o 預(yù)鏈接高價(jià)值數(shù)據(jù)集,如衛(wèi)生-就業(yè)一體化,為公共服務(wù)提供人工智能驅(qū)動(dòng)的解決方案。
2、解決成本問題
為確保被快速采用的勢頭,國家數(shù)據(jù)圖書館必須從一開始就帶來切實(shí)的利益。但同時(shí)應(yīng)明確其非盈利定位,其商業(yè)模式主要目標(biāo)是收回開發(fā)和運(yùn)營成本,而非產(chǎn)生利潤。
報(bào)告提出的建議:
o 制定分層的數(shù)據(jù)訪問付費(fèi)方案,大型企業(yè)按從數(shù)據(jù)中所獲商業(yè)價(jià)值多付費(fèi),學(xué)術(shù)機(jī)構(gòu)和獨(dú)立研究人員則享受折扣。
o 若國家數(shù)據(jù)圖書館開放授權(quán)給外國實(shí)體使用,可以引入一種版稅支付機(jī)制,借鑒ARIA的海外融資機(jī)制,確保國家能夠在公共部門數(shù)據(jù)的經(jīng)濟(jì)價(jià)值中保留相應(yīng)的利益份額。
o 聚焦于五個(gè)與政府任務(wù)相關(guān)聯(lián)的高價(jià)值、高影響用例,通過敏捷沖刺開發(fā)交付“最小可行產(chǎn)品”,以在支持國家優(yōu)先事項(xiàng)中展現(xiàn)價(jià)值。
3、平衡隱私與安全
出于對(duì)國家數(shù)據(jù)圖書館隱私和安全考慮,需要嚴(yán)格的保障措施和明確定義的訪問框架。
報(bào)告提出的建議:
o 建立動(dòng)態(tài)風(fēng)險(xiǎn)分層機(jī)制,定期更新匿名化標(biāo)準(zhǔn),并與獨(dú)立機(jī)構(gòu)合作審查。
o 采用分級(jí)訪問權(quán)限(Reader Pass),通過分層訪問系統(tǒng)來平衡安全性和可用性。
o 開發(fā)先進(jìn)的合成數(shù)據(jù)生成技術(shù),以平衡數(shù)據(jù)效用與隱私保護(hù)。
o 提供更廣泛的可訪問性,同時(shí)保證強(qiáng)大的治理和安全標(biāo)準(zhǔn)。
2.推動(dòng)政策設(shè)計(jì)等四個(gè)領(lǐng)域數(shù)字化變革
國家數(shù)據(jù)圖書館具備推動(dòng)四個(gè)關(guān)鍵領(lǐng)域協(xié)同變革的潛力:政策設(shè)計(jì)、公共服務(wù)、學(xué)術(shù)研究以及商業(yè)研發(fā)(R&D)。這些領(lǐng)域不僅高度依賴高質(zhì)量數(shù)據(jù)作為發(fā)展的基礎(chǔ),而且彼此之間存在深度關(guān)聯(lián)——一個(gè)領(lǐng)域的進(jìn)展往往能夠?yàn)槠渌I(lǐng)域提供新的動(dòng)力和啟發(fā),從而形成相互促進(jìn)的正向循環(huán)。
在政策設(shè)計(jì)領(lǐng)域,國家數(shù)據(jù)圖書館具備實(shí)時(shí)訪問和分析數(shù)據(jù)的能力。使政策制定者能夠快速響應(yīng)社會(huì)經(jīng)濟(jì)變化,制定更有效的政策。通過鏈接和分析大量數(shù)據(jù),國家數(shù)據(jù)圖書館可以幫助政策制定者預(yù)測未來趨勢,從而提前規(guī)劃和應(yīng)對(duì)潛在問題。同時(shí),其透明性框架和數(shù)據(jù)注冊(cè)表可以增加政策制定的透明度,確保公眾對(duì)政策制定過程的信任。
在公共服務(wù)領(lǐng)域,國家數(shù)據(jù)圖書館鏈接不同數(shù)據(jù)集以提供個(gè)性化的公共服務(wù)。如通過分析個(gè)人的健康數(shù)據(jù)和生活習(xí)慣,提供定制化的健康建議和預(yù)防措施。此外,國家數(shù)據(jù)圖書館可自動(dòng)化數(shù)據(jù)處理和分析,提高公共服務(wù)的效率和降低成本。有利于識(shí)別潛在的社會(huì)問題,如貧困、健康風(fēng)險(xiǎn)和犯罪熱點(diǎn),從而實(shí)現(xiàn)早期風(fēng)險(xiǎn)預(yù)警和干預(yù)。
在學(xué)術(shù)研究領(lǐng)域,國家數(shù)據(jù)圖書館提供快速訪問大量高質(zhì)量數(shù)據(jù)的能力,顯著加速科學(xué)研究的進(jìn)程。國家數(shù)據(jù)圖書館可以促進(jìn)不同學(xué)科之間的數(shù)據(jù)共享和合作,整合及提供標(biāo)準(zhǔn)化和高質(zhì)量的數(shù)據(jù),推動(dòng)跨學(xué)科研究的發(fā)展。
在商業(yè)R&D領(lǐng)域,國家數(shù)據(jù)圖書館為企業(yè)提供快速訪問和使用數(shù)據(jù)的能力,加速產(chǎn)品和服務(wù)的開發(fā)和迭代。通過利用國家數(shù)據(jù)圖書館的數(shù)據(jù),企業(yè)可以開發(fā)出更具創(chuàng)新性和競爭力的產(chǎn)品和服務(wù)。并且,國家數(shù)據(jù)圖書館可以作為一個(gè)平臺(tái),促進(jìn)企業(yè)、學(xué)術(shù)界和政府之間的合作,形成一個(gè)支持創(chuàng)新的生態(tài)系統(tǒng)。
對(duì)我國的啟示
我國在數(shù)據(jù)治理市場規(guī)模持續(xù)擴(kuò)張,政策法規(guī)體系正逐步完善。然而,當(dāng)前仍面臨一些挑戰(zhàn),如部門間信息系統(tǒng)標(biāo)準(zhǔn)不一,數(shù)據(jù)分散整合困難,數(shù)據(jù)分析效能不高。報(bào)告建議建立國家數(shù)據(jù)圖書館推動(dòng)AI創(chuàng)新發(fā)展,并且不要試圖集中所有數(shù)據(jù),而是推薦采用數(shù)據(jù)聯(lián)邦架構(gòu)等方式。這對(duì)我國推動(dòng)高質(zhì)量數(shù)據(jù)集建設(shè)工作,為AI技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)而言具有參考意義。
一是降低大型國家級(jí)數(shù)據(jù)庫的使用門檻。通過集中化元數(shù)據(jù)目錄,簡化數(shù)據(jù)發(fā)現(xiàn)流程。提供“開箱即用”分析包,降低數(shù)據(jù)使用壁壘。設(shè)立專業(yè)服務(wù)臺(tái),使用戶能夠有效地讀取和處理數(shù)據(jù)集。
二是平衡數(shù)據(jù)效用和安全性。在充分發(fā)揮數(shù)據(jù)價(jià)值的同時(shí),必須加強(qiáng)隱私保護(hù)和合規(guī)管理,確保數(shù)據(jù)的使用符合法律法規(guī),避免因安全問題影響數(shù)據(jù)的共享和應(yīng)用。
三是解決數(shù)據(jù)庫運(yùn)營成本問題。通過合理規(guī)劃商業(yè)模式和資源配置,可以有效降低開發(fā)和維護(hù)成本,確保數(shù)據(jù)庫在經(jīng)濟(jì)上具備可持續(xù)性,為國家數(shù)據(jù)治理和人工智能發(fā)展提供堅(jiān)實(shí)基礎(chǔ)。