【摘要】歷經(jīng)數(shù)據(jù)互聯(lián)網(wǎng)、信息互聯(lián)網(wǎng),互聯(lián)網(wǎng)發(fā)展當(dāng)前進入了價值互聯(lián)網(wǎng)階段。在數(shù)據(jù)與應(yīng)用解耦的趨勢背景下,互聯(lián)網(wǎng)基礎(chǔ)技術(shù)亟需從支撐網(wǎng)間互聯(lián)、網(wǎng)站互聯(lián)到支撐數(shù)島互聯(lián),數(shù)據(jù)互操作技術(shù)是支撐數(shù)島互聯(lián)的基礎(chǔ)性技術(shù)。數(shù)據(jù)互操作解決數(shù)據(jù)的標識確權(quán)、認證授權(quán)、安全交換三大核心問題,在技術(shù)實現(xiàn)上基于現(xiàn)有的DNS(域名系統(tǒng))向DIS(數(shù)據(jù)互操作系統(tǒng))演進,并形成DIP/RDF(數(shù)據(jù)互操作協(xié)議/資源描述框架)協(xié)議規(guī)范,支持數(shù)據(jù)應(yīng)用模式從“數(shù)據(jù)中臺”向“數(shù)據(jù)中樞”轉(zhuǎn)變。隨著經(jīng)濟社會發(fā)展對高質(zhì)量數(shù)據(jù)的需求進一步提升,數(shù)據(jù)基礎(chǔ)設(shè)施將從網(wǎng)絡(luò)基礎(chǔ)設(shè)施中分離,數(shù)據(jù)互操作技術(shù)將成為數(shù)據(jù)基礎(chǔ)設(shè)施的重要組成部分。數(shù)據(jù)基礎(chǔ)設(shè)施的市場化運作將帶動數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè)的發(fā)展,并支撐數(shù)字技術(shù)、數(shù)字產(chǎn)業(yè)等上層應(yīng)用蓬勃發(fā)展。
【關(guān)鍵詞】互聯(lián)網(wǎng)基礎(chǔ)技術(shù) 數(shù)據(jù)互操作 數(shù)據(jù)基礎(chǔ)設(shè)施 數(shù)字經(jīng)濟
【中圖分類號】TP39 【文獻標識碼】A
當(dāng)前,全球互聯(lián)網(wǎng)發(fā)展迎來戰(zhàn)略機遇疊加的特殊窗口期,以價值互聯(lián)網(wǎng)支撐知識交換為特征的第四次工業(yè)革命驅(qū)動全球數(shù)字經(jīng)濟發(fā)展進入新階段。黨的二十大報告提出加快建設(shè)“網(wǎng)絡(luò)強國、數(shù)字中國”,《中共中央 國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(簡稱“數(shù)據(jù)二十條”)、《數(shù)字中國建設(shè)整體布局規(guī)劃》等頂層戰(zhàn)略文件出臺,配合組建國家數(shù)據(jù)局等行政機構(gòu)體制改革,旨在破除數(shù)字經(jīng)濟發(fā)展的制度障礙。數(shù)字經(jīng)濟發(fā)展對其互聯(lián)網(wǎng)底座提出了更高要求,互聯(lián)網(wǎng)發(fā)展新階段基礎(chǔ)技術(shù)攻關(guān)的核心,應(yīng)圍繞支撐數(shù)字經(jīng)濟發(fā)展所需的更高知識密度和更小治理粒度的可信數(shù)據(jù)展開。
互聯(lián)網(wǎng)發(fā)展進入價值互聯(lián)網(wǎng)階段
互聯(lián)網(wǎng)誕生于信息化進程的數(shù)字化階段,發(fā)展于網(wǎng)絡(luò)化階段,爆發(fā)于智能化階段。隨著網(wǎng)絡(luò)規(guī)模的擴大和數(shù)據(jù)的累積,其核心需求從早期的數(shù)據(jù)交換、信息共享逐步演變?yōu)橹谓?jīng)濟社會發(fā)展的知識構(gòu)建,推動互聯(lián)網(wǎng)從數(shù)據(jù)互聯(lián)網(wǎng)、信息互聯(lián)網(wǎng)發(fā)展至價值互聯(lián)網(wǎng)階段。
數(shù)據(jù)互聯(lián)網(wǎng)階段(1974—1994年),核心需求是數(shù)據(jù)交換,關(guān)鍵問題是如何在不可靠的異構(gòu)網(wǎng)絡(luò)上實現(xiàn)可靠的數(shù)據(jù)傳輸。早期的阿帕網(wǎng)中,主機之間的連接和通信前提是同構(gòu)網(wǎng)絡(luò),但隨著網(wǎng)絡(luò)數(shù)據(jù)傳輸需求的逐漸擴大和復(fù)雜化,出現(xiàn)了難以定位目標主機、傳輸錯誤率高、網(wǎng)絡(luò)運行效率低等問題。因此,該階段需要解決的關(guān)鍵問題是,如何規(guī)范數(shù)據(jù)包格式、統(tǒng)一通信協(xié)議的規(guī)范,實現(xiàn)主機互聯(lián),滿足全球范圍內(nèi)、異構(gòu)網(wǎng)絡(luò)間的可靠數(shù)據(jù)傳輸?shù)钠惹行枨蟆?974年,羅伯特·卡恩和溫頓·瑟夫提出的傳輸控制技術(shù)(TCP/IP協(xié)議前身)實現(xiàn)了數(shù)據(jù)包的封裝,以及在不可靠的網(wǎng)絡(luò)中將數(shù)據(jù)包從一臺設(shè)備可靠地傳輸?shù)搅硪慌_設(shè)備,有效地減少了網(wǎng)絡(luò)連接和傳輸過程中的錯誤,提升了網(wǎng)絡(luò)運行效率。此階段,電子郵件、文件傳輸服務(wù)是典型應(yīng)用,主機、路由器、電纜等通信物理設(shè)施是關(guān)鍵數(shù)字基礎(chǔ)設(shè)施。
信息互聯(lián)網(wǎng)階段(1994—2014年),核心需求是信息共享,關(guān)鍵問題是如何在非結(jié)構(gòu)化的網(wǎng)絡(luò)上結(jié)構(gòu)化描述數(shù)據(jù)以形成信息。隨著互聯(lián)網(wǎng)接入規(guī)模的擴大,人們利用互聯(lián)網(wǎng)完成信息交互的需求逐漸凸顯。然而,由于缺乏信息獲取入口和信息共享途徑,多方之間高效的信息交互難以實現(xiàn)。因此,探索新的協(xié)議和規(guī)范,促進互聯(lián)網(wǎng)中廣泛的信息共享,成為互聯(lián)網(wǎng)的新發(fā)展方向。HTTP/HTML(超文本傳輸協(xié)議/超文本標記語言)是解決信息交互問題的關(guān)鍵技術(shù)和標準,由蒂姆·伯納斯·李提出,并于1994年成立萬維網(wǎng)聯(lián)盟來進行標準化和推廣應(yīng)用。信息用HTML進行結(jié)構(gòu)化表述,遵循HTTP協(xié)議規(guī)范傳輸,實現(xiàn)了以結(jié)構(gòu)化的信息描述方式來表述非結(jié)構(gòu)化的網(wǎng)絡(luò)數(shù)據(jù),使得可獨立于互聯(lián)網(wǎng)主機之間的差異,在不同的硬件和操作系統(tǒng)上以相似的形式顯示信息,促進了互聯(lián)網(wǎng)中的跨域信息共享。隨著網(wǎng)站數(shù)量的大規(guī)模增加,主要實現(xiàn)網(wǎng)站名稱和主機地址映射的域名系統(tǒng)(Domain Name System,DNS)的重要性逐漸增強。域名系統(tǒng)通過對網(wǎng)站地址采用有語義的名字標識命名,實現(xiàn)了對網(wǎng)站的快速尋址,進一步推動了互聯(lián)網(wǎng)中的信息共享。此階段,門戶網(wǎng)站、電子商務(wù)、社交媒體等是典型應(yīng)用,域名系統(tǒng)是關(guān)鍵數(shù)字基礎(chǔ)設(shè)施。
價值互聯(lián)網(wǎng)階段(2014年至今),核心需求是知識構(gòu)建,關(guān)鍵問題是如何在不可信的網(wǎng)絡(luò)上交換可信數(shù)據(jù)以形成知識。數(shù)字經(jīng)濟以數(shù)字化的數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素,用以產(chǎn)生信息、知識和創(chuàng)造價值。然而,不可信網(wǎng)絡(luò)中的數(shù)據(jù)交換存在以下問題:一是數(shù)據(jù)安全無法保障,數(shù)據(jù)侵權(quán)、數(shù)據(jù)泄露等現(xiàn)象頻發(fā),引發(fā)相關(guān)個體、企業(yè)對數(shù)據(jù)安全的擔(dān)憂,導(dǎo)致數(shù)據(jù)的過度保護,阻礙數(shù)據(jù)的流通;二是數(shù)據(jù)真實性難以保證,偽造數(shù)據(jù)、劣質(zhì)數(shù)據(jù)層出不窮,數(shù)據(jù)使用者難以依托互聯(lián)網(wǎng)數(shù)據(jù)構(gòu)建有價值的知識成果,導(dǎo)致無效的數(shù)據(jù)挖掘,阻礙數(shù)據(jù)應(yīng)用的發(fā)展;三是數(shù)據(jù)價值分配缺乏合理性,互聯(lián)網(wǎng)平臺利用優(yōu)質(zhì)創(chuàng)作內(nèi)容吸引非創(chuàng)作用戶流量、實現(xiàn)快速變現(xiàn),但用戶無法通過自身產(chǎn)生的內(nèi)容數(shù)據(jù)獲得合法收益,導(dǎo)致用戶的消極情緒,阻礙數(shù)據(jù)的持續(xù)產(chǎn)出。因此,探索新的規(guī)范和協(xié)議,保障數(shù)據(jù)安全、真實并實現(xiàn)數(shù)據(jù)價值的合理分配,達成數(shù)據(jù)的可信交換,是價值互聯(lián)網(wǎng)階段的主要任務(wù)。區(qū)塊鏈技術(shù)是滿足可信數(shù)據(jù)交換的關(guān)鍵技術(shù)之一,也是融合加密技術(shù)、共識機制及圖靈完備的智能合約語言的可信計算平臺,將通過維護不可篡改的分布式賬本,支撐價值互聯(lián)網(wǎng)中可信化要求的新的基礎(chǔ)設(shè)施構(gòu)建。同時,為解決上述數(shù)據(jù)安全、可信及價值分配等問題,區(qū)塊鏈技術(shù)還需完善并融合承載數(shù)據(jù)治理規(guī)則和數(shù)據(jù)要素利用的數(shù)據(jù)互操作技術(shù),在彌合網(wǎng)絡(luò)碎片和連通數(shù)據(jù)孤島的基礎(chǔ)上,保障數(shù)據(jù)全生命周期的可信、可用、可管、可控。
價值互聯(lián)網(wǎng)需要數(shù)據(jù)互操作技術(shù)
數(shù)據(jù)價值的凸顯和數(shù)據(jù)安全的加強迫使數(shù)據(jù)與應(yīng)用解耦,逐漸成為可控可信的數(shù)據(jù)自治空間,形成眾多的數(shù)據(jù)孤島(簡稱數(shù)島)。因此,實現(xiàn)數(shù)島互聯(lián)以完成數(shù)據(jù)互操作,成為價值互聯(lián)網(wǎng)階段的重要課題?;ヂ?lián)網(wǎng)發(fā)展至今,顛覆性的技術(shù)創(chuàng)新難以打敗兼容性的技術(shù)演進,數(shù)據(jù)互操作的技術(shù)實現(xiàn)必須以現(xiàn)有互聯(lián)網(wǎng)基礎(chǔ)技術(shù)為依托,逐步形成新的互聯(lián)網(wǎng)協(xié)議標準。
第一,互聯(lián)網(wǎng)發(fā)展新階段數(shù)據(jù)互操作至關(guān)重要?;ヂ?lián)網(wǎng)發(fā)展新階段,數(shù)據(jù)與應(yīng)用解耦成為關(guān)鍵特征。信息化進程從數(shù)字化、網(wǎng)絡(luò)化發(fā)展到智能化階段,數(shù)據(jù)與應(yīng)用的關(guān)系隨之發(fā)生變化。在數(shù)字化階段,由于互聯(lián)網(wǎng)技術(shù)還沒有普及,數(shù)據(jù)和應(yīng)用在用戶本地,用戶對數(shù)據(jù)具有完全的控制權(quán)。隨著數(shù)據(jù)產(chǎn)生速率的持續(xù)提升和應(yīng)用模式的不斷創(chuàng)新,數(shù)據(jù)交換成為基本需求,直接推動了互聯(lián)網(wǎng)的誕生。同時,數(shù)字化數(shù)據(jù)的傳輸容量和傳輸速度需求進一步推動了網(wǎng)絡(luò)技術(shù)的發(fā)展。在網(wǎng)絡(luò)化階段,互聯(lián)網(wǎng)服務(wù)的發(fā)展催生了數(shù)據(jù)和應(yīng)用均在網(wǎng)絡(luò)云端的新模式?;ヂ?lián)網(wǎng)服務(wù)為人們生活帶來極大便利,但也導(dǎo)致了用戶數(shù)據(jù)完全由云服務(wù)提供者掌握,用戶逐漸失去了數(shù)據(jù)的控制權(quán)?;ヂ?lián)網(wǎng)平臺作為數(shù)據(jù)的實際控制者和數(shù)據(jù)價值的直接受益者,承擔(dān)起數(shù)據(jù)安全、可信、可控的全部責(zé)任。然而,互聯(lián)網(wǎng)平臺僅是數(shù)據(jù)全生命周期的一個參與者,目前數(shù)據(jù)收益分配機制不利于數(shù)據(jù)產(chǎn)業(yè)生態(tài)的健康可持續(xù)發(fā)展。在智能化階段,數(shù)據(jù)和應(yīng)用解耦成為必然趨勢。在《數(shù)據(jù)安全法》和《個人信息保護法》等相關(guān)法律法規(guī)相繼出臺促使數(shù)據(jù)合規(guī)及治理要求越來越高的同時,終端計算能力也隨著數(shù)字技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展逐步提升,隱私數(shù)據(jù)和重要數(shù)據(jù)以相關(guān)方可選擇的方式存儲于安全、可信、可控的數(shù)據(jù)自治空間中,應(yīng)用服務(wù)提供方在經(jīng)過相關(guān)方許可的前提下,“按需使用”獲取數(shù)據(jù),以進一步提供服務(wù)。同時,建立數(shù)據(jù)價值分配機制,也可以使用戶依靠生產(chǎn)數(shù)據(jù)獲取持續(xù)收益。
數(shù)據(jù)與應(yīng)用解耦促使互聯(lián)網(wǎng)應(yīng)用和數(shù)據(jù)之間交叉訪問需求增加,使得數(shù)據(jù)互操作成為互聯(lián)網(wǎng)發(fā)展新階段的重要關(guān)切。互操作是指不同計算機系統(tǒng)、網(wǎng)絡(luò)、操作系統(tǒng)和應(yīng)用程序一起工作并共享信息的過程,存在于互聯(lián)網(wǎng)誕生之初,并伴隨著互聯(lián)網(wǎng)發(fā)展而演進。數(shù)據(jù)互聯(lián)網(wǎng)階段,互操作技術(shù)專注于實現(xiàn)主機間的通信,完成異構(gòu)網(wǎng)絡(luò)間的數(shù)據(jù)交換;信息互聯(lián)網(wǎng)階段,互操作技術(shù)專注于實現(xiàn)網(wǎng)站間的統(tǒng)一規(guī)范,完成不同網(wǎng)站間的信息共享;價值互聯(lián)網(wǎng)階段,數(shù)據(jù)與應(yīng)用解耦將推動互聯(lián)網(wǎng)應(yīng)用和數(shù)據(jù)之間交叉訪問,應(yīng)用與數(shù)據(jù)的一對一關(guān)系將演變?yōu)槎鄬Χ嚓P(guān)系,從而大幅提升互操作的復(fù)雜度,解決數(shù)島間的數(shù)據(jù)互操作成為關(guān)鍵。
互聯(lián)網(wǎng)數(shù)據(jù)互操作是用于解決數(shù)據(jù)跨域互聯(lián)互通和交換共享的互聯(lián)網(wǎng)基礎(chǔ)技術(shù),秉持“數(shù)據(jù)不離域,可用不可見”的基本原則,驅(qū)動數(shù)據(jù)應(yīng)用從“數(shù)據(jù)中臺”到“數(shù)據(jù)中樞”模式的轉(zhuǎn)變。一方面,由TCP/IP、HTTP/HTML、DNS等協(xié)議構(gòu)成的傳統(tǒng)互聯(lián)網(wǎng)基礎(chǔ)技術(shù),作為連接互聯(lián)網(wǎng)物理基礎(chǔ)設(shè)施、支撐互聯(lián)網(wǎng)多樣化應(yīng)用的關(guān)鍵技術(shù),因未考慮數(shù)據(jù)權(quán)屬和保護問題,造成數(shù)據(jù)訪問受控于網(wǎng)站,難以滿足數(shù)據(jù)與應(yīng)用解耦模式下可信數(shù)據(jù)交換的要求,制約了數(shù)據(jù)要素的流動和價值釋放;另一方面,傳統(tǒng)以“數(shù)據(jù)中臺”為基本模式的跨域數(shù)據(jù)交換,因存在一個收集原始數(shù)據(jù)的集中平臺,導(dǎo)致數(shù)據(jù)需從本地可控存儲流向集中的不可控第三方平臺,同樣造成數(shù)據(jù)安全可信保障的困難。因此,數(shù)據(jù)互操作技術(shù)需從保護數(shù)據(jù)安全及權(quán)屬的角度出發(fā),基于已有的互聯(lián)網(wǎng)基礎(chǔ)技術(shù),構(gòu)建應(yīng)用與數(shù)據(jù)之間的“橋梁”;避免數(shù)據(jù)的離域,用“數(shù)據(jù)中樞”的新型模式替換“數(shù)據(jù)中臺”的傳統(tǒng)模式,用跨域數(shù)據(jù)索引與確權(quán)替代傳統(tǒng)數(shù)據(jù)中心存儲數(shù)據(jù)的方式,在歸還數(shù)據(jù)管理與授權(quán)的基礎(chǔ)上,實現(xiàn)對互聯(lián)網(wǎng)數(shù)據(jù)資源的定位,在保障數(shù)據(jù)權(quán)屬的前提下安全交換數(shù)據(jù),為數(shù)據(jù)與應(yīng)用解耦后的數(shù)據(jù)高效利用夯實基礎(chǔ)。
第二,數(shù)據(jù)互操作技術(shù)支持數(shù)據(jù)跨域互聯(lián)互通。數(shù)據(jù)互操作技術(shù)需貫穿數(shù)據(jù)采集、傳輸、存儲、計算、應(yīng)用、消亡的數(shù)據(jù)全生命周期,支持發(fā)現(xiàn)和定位數(shù)據(jù)資源,并在保障數(shù)據(jù)權(quán)屬和促進數(shù)據(jù)可信的前提下實現(xiàn)數(shù)據(jù)資源安全交換。數(shù)據(jù)互操作需解決標識確權(quán)、認證授權(quán)和安全交換三大關(guān)鍵問題,并支撐數(shù)據(jù)標識體系、數(shù)據(jù)確權(quán)體系、身份認證體系、訪問授權(quán)體系、分級分類體系、算法管理體系構(gòu)建。其中,統(tǒng)一標準的標識體系為數(shù)據(jù)建立全球唯一標識索引,形成共享和交換數(shù)據(jù)信息的紐帶,使得產(chǎn)生的數(shù)據(jù)能被發(fā)現(xiàn)、需要的數(shù)據(jù)能被找到;統(tǒng)一標準的確權(quán)體系,明確數(shù)據(jù)權(quán)屬,保障數(shù)據(jù)持有者、加工者、經(jīng)營者等各方的合法權(quán)益;統(tǒng)一標準的認證體系,確保身份的唯一性和不可偽造性,為數(shù)據(jù)的跨域使用提供分布式身份認證能力,打破因無法認證操作者而拒絕數(shù)據(jù)跨域使用的現(xiàn)狀;統(tǒng)一標識的授權(quán)體系,僅允許經(jīng)授權(quán)后的數(shù)據(jù)訪問,以保障數(shù)據(jù)可控,保證數(shù)據(jù)互操作流程的安全性和合法性,減輕個人、企業(yè)等對數(shù)據(jù)侵權(quán)進一步引發(fā)的數(shù)據(jù)泄露等問題的擔(dān)憂;統(tǒng)一標準的分類分級體系,以依據(jù)核心數(shù)據(jù)、重要數(shù)據(jù)、一般數(shù)據(jù)構(gòu)成的分級框架和公共個人維度、公共管理維度、信息傳播維度、行業(yè)領(lǐng)域維度的分類規(guī)則,形成具體可操作、可執(zhí)行的數(shù)據(jù)分類分級標準,保障數(shù)據(jù)跨域互操作過程的合規(guī)性;統(tǒng)一標準的算法管理體系,對可信算法統(tǒng)一管理和認證,以結(jié)合現(xiàn)有的隱私保護技術(shù),在不離域的前提下實現(xiàn)科學(xué)數(shù)據(jù)的價值釋放。
數(shù)據(jù)互操作技術(shù)的“互操作”需要做到與現(xiàn)有技術(shù)向后兼容的數(shù)據(jù)互聯(lián)互通。因此,以標識為基礎(chǔ),發(fā)揮已有互聯(lián)網(wǎng)基礎(chǔ)技術(shù)的能力和優(yōu)勢進一步推動技術(shù)演進,是數(shù)據(jù)互操作技術(shù)的主要實現(xiàn)思路。從最初以地址標識為基礎(chǔ)的路由系統(tǒng),到以名字標識為基礎(chǔ)的域名系統(tǒng),支撐數(shù)據(jù)交換、信息共享的歷史要求雖已完成,但已難以適應(yīng)當(dāng)前知識構(gòu)建和價值交換的要求,因而一種以泛在標識為基礎(chǔ)的數(shù)據(jù)標識系統(tǒng)的產(chǎn)生成為必然。當(dāng)前,域名及域名系統(tǒng)是互聯(lián)網(wǎng)關(guān)鍵資源的核心連接點,它基于對IP地址等資源的關(guān)聯(lián)和映射,不僅將全球的網(wǎng)站連接在一起,更是成為全球互聯(lián)網(wǎng)的中樞神經(jīng)系統(tǒng)。實現(xiàn)全球的數(shù)據(jù)連接,構(gòu)建數(shù)字經(jīng)濟的中樞神經(jīng)系統(tǒng),要實現(xiàn)從DNS(域名系統(tǒng))到DIS(數(shù)據(jù)互操作系統(tǒng))的演進。需要強調(diào)的是,數(shù)據(jù)互操作技術(shù)要實現(xiàn)向后兼容,以符合互聯(lián)網(wǎng)統(tǒng)一標準的方式發(fā)現(xiàn)和定位數(shù)據(jù)資源,并在保障數(shù)據(jù)權(quán)屬和促進數(shù)據(jù)可信的前提下實現(xiàn)數(shù)據(jù)資源的安全交換,而不是自建體系。這既是互聯(lián)網(wǎng)基礎(chǔ)技術(shù)創(chuàng)新的趨勢,也是數(shù)據(jù)治理落地實施的保障,更是數(shù)字經(jīng)濟發(fā)展對數(shù)據(jù)基礎(chǔ)設(shè)施的要求。
數(shù)據(jù)互操作技術(shù)的“互操作”還需達成國際數(shù)據(jù)孤島間的互操作,推動DIP/RDF(數(shù)據(jù)互操作協(xié)議/資源描述框架)國際統(tǒng)一標準的形成,實現(xiàn)全球范圍的數(shù)據(jù)互聯(lián)互通。在不同互聯(lián)網(wǎng)發(fā)展階段,互聯(lián)網(wǎng)基礎(chǔ)技術(shù)始終由資源描述規(guī)范及配套的傳輸協(xié)議構(gòu)成。在價值互聯(lián)網(wǎng)階段,一種用于描述數(shù)據(jù)資源及可信數(shù)據(jù)資源傳輸?shù)膮f(xié)議,對于實現(xiàn)數(shù)島互聯(lián)至關(guān)重要。RDF是一種描述數(shù)據(jù)資源元數(shù)據(jù)的規(guī)范模型,以<資源,屬性,陳述>三元組為基本元素,用于描述數(shù)據(jù)資源的基本特性及關(guān)系,該技術(shù)是實現(xiàn)數(shù)據(jù)資源重用和數(shù)據(jù)交換的關(guān)鍵,更是互聯(lián)網(wǎng)數(shù)據(jù)機器可讀、進一步實現(xiàn)大規(guī)模數(shù)據(jù)應(yīng)用的基礎(chǔ)。數(shù)據(jù)互操作技術(shù)將以RDF作為數(shù)據(jù)資源描述的基本規(guī)范,推動跨域數(shù)據(jù)互聯(lián)互通的數(shù)據(jù)資源傳輸協(xié)議——數(shù)據(jù)互操作協(xié)議DIP的標準化工作,在國際社區(qū)形成數(shù)據(jù)互操作共識,進一步促進數(shù)據(jù)價值流通,擴大數(shù)據(jù)應(yīng)用范圍。
數(shù)據(jù)互操作技術(shù)釋放數(shù)據(jù)要素價值
數(shù)據(jù)互操作技術(shù)有助于保障數(shù)據(jù)內(nèi)容可信、數(shù)據(jù)交易安全、收益分配公平,在未來,數(shù)據(jù)互操作技術(shù)將成為數(shù)據(jù)基礎(chǔ)設(shè)施的核心技術(shù),而數(shù)據(jù)基礎(chǔ)設(shè)施的形成和發(fā)展,有助于推動在高質(zhì)量數(shù)據(jù)互聯(lián)互通基礎(chǔ)上的應(yīng)用生態(tài)蓬勃發(fā)展。
第一,數(shù)據(jù)互操作技術(shù)支撐數(shù)據(jù)基礎(chǔ)設(shè)施構(gòu)建。2023年2月,中共中央、國務(wù)院印發(fā)《數(shù)字中國建設(shè)整體布局規(guī)劃》(以下簡稱《規(guī)劃》)明確,數(shù)字中國建設(shè)要“夯實數(shù)字基礎(chǔ)設(shè)施和數(shù)據(jù)資源體系‘兩大基礎(chǔ)’”,并將數(shù)字基礎(chǔ)設(shè)施劃分為網(wǎng)絡(luò)基礎(chǔ)設(shè)施、算力基礎(chǔ)設(shè)施和應(yīng)用基礎(chǔ)設(shè)施三類。支撐數(shù)據(jù)資源體系的數(shù)據(jù)基礎(chǔ)設(shè)施某種意義上屬于網(wǎng)絡(luò)基礎(chǔ)設(shè)施的范疇,并連接算力基礎(chǔ)設(shè)施和支撐應(yīng)用基礎(chǔ)設(shè)施。推動數(shù)字經(jīng)濟高質(zhì)量可持續(xù)發(fā)展是數(shù)字基礎(chǔ)設(shè)施建設(shè)的最終目的,數(shù)據(jù)要素是數(shù)字經(jīng)濟發(fā)展的最活躍增長要素,數(shù)字基礎(chǔ)設(shè)施應(yīng)支撐數(shù)據(jù)全生命周期的高效流通。以暢通數(shù)據(jù)資源大循環(huán)為價值導(dǎo)向,必然促使數(shù)據(jù)基礎(chǔ)設(shè)施從網(wǎng)絡(luò)基礎(chǔ)設(shè)施中分離出來。網(wǎng)絡(luò)基礎(chǔ)設(shè)施主要完成數(shù)據(jù)的采集和傳輸,算力基礎(chǔ)設(shè)施主要完成數(shù)據(jù)的存儲和計算,應(yīng)用基礎(chǔ)設(shè)施主要完成數(shù)據(jù)的分析和應(yīng)用,數(shù)據(jù)基礎(chǔ)設(shè)施則貫穿和連接網(wǎng)絡(luò)基礎(chǔ)設(shè)施、算力基礎(chǔ)設(shè)施和應(yīng)用基礎(chǔ)設(shè)施,打通數(shù)據(jù)資源體系,促進數(shù)據(jù)循環(huán)暢通,從而釋放數(shù)據(jù)要素價值。
類比于工業(yè)經(jīng)濟時代圍繞資本流通建立的監(jiān)管體系,數(shù)據(jù)基礎(chǔ)設(shè)施幫助實現(xiàn)對數(shù)據(jù)要素的統(tǒng)籌管理與宏觀調(diào)配。一方面,數(shù)據(jù)基礎(chǔ)設(shè)施對內(nèi)保障數(shù)據(jù)本身的安全可靠,對外促進數(shù)據(jù)全生命周期各環(huán)節(jié)之間的聯(lián)動配合;另一方面,數(shù)據(jù)治理與安全保障能促使更多的高價值數(shù)據(jù)從封閉的系統(tǒng)平臺中釋放出來,并保障數(shù)據(jù)全生命周期的安全有序流通。
數(shù)據(jù)互操作技術(shù)是數(shù)據(jù)基礎(chǔ)設(shè)施構(gòu)建的核心技術(shù)。在本質(zhì)上,數(shù)據(jù)互操作技術(shù)是一套實現(xiàn)數(shù)據(jù)交換的機制設(shè)計,包含標識確權(quán)、認證授權(quán)、安全交換三個核心步驟,其中標識確權(quán)和認證授權(quán)對應(yīng)了數(shù)據(jù)交換確權(quán)和行權(quán)的過程,明確了數(shù)據(jù)提供方的權(quán)利和義務(wù),即負有保證數(shù)據(jù)內(nèi)容真實可靠、安全合規(guī)的義務(wù),同時也享有根據(jù)數(shù)據(jù)的實際價值、需求程度、數(shù)據(jù)質(zhì)量獲得收益分配的權(quán)利;而安全交換則對應(yīng)于數(shù)據(jù)交換過程的安全性。此外,數(shù)據(jù)互操作系統(tǒng)承載了基于此系統(tǒng)實現(xiàn)的每一筆數(shù)據(jù)交換的真實記錄。就技術(shù)定位而言,數(shù)據(jù)互操作實現(xiàn)了對從采集傳輸?shù)綉?yīng)用消亡的數(shù)據(jù)全生命周期的監(jiān)管。數(shù)據(jù)互操作是數(shù)據(jù)基礎(chǔ)設(shè)施的底層技術(shù)架構(gòu),數(shù)據(jù)基礎(chǔ)設(shè)施應(yīng)包含的其他功能,如數(shù)據(jù)內(nèi)容審核、任務(wù)資源分配等,都能夠基于這一底層機制和技術(shù)架構(gòu)向上構(gòu)建。在未來,數(shù)據(jù)基礎(chǔ)設(shè)施的內(nèi)涵與功能將隨著現(xiàn)實數(shù)據(jù)需求與數(shù)據(jù)治理實踐的變化而不斷豐富,但圍繞每一次數(shù)據(jù)交換的實現(xiàn)思路與方向是基本不變的。就具體功能而言,明確數(shù)據(jù)權(quán)屬以及保障交換安全本身屬于“控制”的具體內(nèi)涵,其中,明確的數(shù)據(jù)權(quán)屬配合真實的交換記錄為數(shù)據(jù)治理提供依據(jù)。數(shù)據(jù)互操作系統(tǒng)能夠與數(shù)據(jù)治理規(guī)則相容,從數(shù)據(jù)流通的底層架構(gòu)中為數(shù)據(jù)治理留出操作窗口,對數(shù)據(jù)治理手段進行數(shù)字化賦能,使其不再獨立于技術(shù)系統(tǒng)與平臺之外。
第二,數(shù)據(jù)基礎(chǔ)設(shè)施支撐數(shù)字化發(fā)展應(yīng)用生態(tài)。一方面,互聯(lián)網(wǎng)發(fā)展面臨的新問題、新需求會助推數(shù)據(jù)基礎(chǔ)設(shè)施的發(fā)展并形成相關(guān)產(chǎn)業(yè);另一方面,數(shù)據(jù)基礎(chǔ)設(shè)施的發(fā)展成熟,也將支撐上層應(yīng)用不斷取得新突破。
任何技術(shù)的推廣與普及都必然以市場化的方式運作并形成相關(guān)產(chǎn)業(yè),數(shù)據(jù)基礎(chǔ)設(shè)施的發(fā)展將助推形成數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè),并在納入數(shù)字經(jīng)濟核心產(chǎn)業(yè)的統(tǒng)計范疇以及數(shù)字經(jīng)濟運行中發(fā)揮特定的作用、扮演固定的角色。當(dāng)前,中國已建成世界規(guī)模領(lǐng)先的數(shù)字基礎(chǔ)設(shè)施,其中,網(wǎng)絡(luò)基礎(chǔ)設(shè)施規(guī)模全球最大,算力規(guī)模位居全球第二?!稊?shù)字中國發(fā)展報告(2021年)》指出,2017年到2021年,我國數(shù)據(jù)產(chǎn)量從2.3ZB增長至6.6ZB,全球占比9.9%,位居世界第二。隨著中國產(chǎn)生的數(shù)據(jù)量呈指數(shù)級增長,數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè)也將發(fā)展至與其他數(shù)字基礎(chǔ)設(shè)施相當(dāng)?shù)捏w量與規(guī)模,數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)業(yè)的發(fā)展蘊含著巨大的市場機會和廣闊的想象空間。
數(shù)據(jù)基礎(chǔ)設(shè)施助力數(shù)字技術(shù)迭代升級。大數(shù)據(jù)、云計算、區(qū)塊鏈、物聯(lián)網(wǎng)、人工智能等數(shù)字技術(shù)作用于數(shù)據(jù)生命周期的部分環(huán)節(jié)甚至全流程,數(shù)字技術(shù)的迭代升級與數(shù)據(jù)互聯(lián)互通息息相關(guān)。以人工智能技術(shù)為例,機器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)是大型語言類模型出現(xiàn)之前,人工智能技術(shù)中應(yīng)用最為廣泛的門類,能夠較好地解決圖像識別、聲音識別等問題,并應(yīng)用于人臉識別門禁卡、無人駕駛汽車等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)技術(shù)理念的提出最早可以追溯到McCulloch and Pitts(1943),上世紀六十年代曾經(jīng)歷了技術(shù)理論的繁榮發(fā)展期,但是神經(jīng)網(wǎng)絡(luò)技術(shù)直到2010年才開始大規(guī)模普及應(yīng)用,算力基礎(chǔ)設(shè)施不健全與數(shù)據(jù)資源匱乏是其中的主要限制因素。同樣,算力基礎(chǔ)設(shè)施與豐富的數(shù)據(jù)資源支撐了ChatGPT等大型語言類人工智能模型的構(gòu)建。一方面,ChatGPT等大型語言類模型的發(fā)展高度依賴于高知識密度數(shù)據(jù)的積累,而“數(shù)據(jù)孤島”問題的凸顯,難以有效支撐人工智能技術(shù)及其應(yīng)用的發(fā)展,這就需要數(shù)據(jù)基礎(chǔ)設(shè)施為人工智能技術(shù)的發(fā)展提供豐富的高知識密度數(shù)據(jù);另一方面,ChatGPT等大型語言類人工智能模型的發(fā)展隱含一定治理風(fēng)險,呼喚數(shù)據(jù)基礎(chǔ)設(shè)施在數(shù)據(jù)資源體系大循環(huán)中扮演總體控制的角色。
數(shù)據(jù)基礎(chǔ)設(shè)施賦能相關(guān)產(chǎn)業(yè)發(fā)展壯大。從數(shù)據(jù)要素產(chǎn)生的邏輯來看,可將各類產(chǎn)業(yè)分為數(shù)據(jù)原生產(chǎn)業(yè)和數(shù)據(jù)次生產(chǎn)業(yè),數(shù)據(jù)原生產(chǎn)業(yè)從產(chǎn)生之日起就依托于數(shù)據(jù)存在并發(fā)展,數(shù)據(jù)次生產(chǎn)業(yè)則指傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型、數(shù)據(jù)基因的植入與產(chǎn)業(yè)數(shù)字作用機制的形成(江小涓和靳景,2022)。對于數(shù)據(jù)原生產(chǎn)業(yè)而言,數(shù)據(jù)基礎(chǔ)設(shè)施促進高價值數(shù)據(jù)釋放,直接推動了數(shù)據(jù)原生產(chǎn)業(yè)的發(fā)展。對于數(shù)據(jù)次生產(chǎn)業(yè)而言,數(shù)據(jù)基礎(chǔ)設(shè)施賦能傳統(tǒng)產(chǎn)業(yè),使之向數(shù)據(jù)次生產(chǎn)業(yè)演進。制造業(yè)是發(fā)展實體經(jīng)濟的重點,數(shù)據(jù)基礎(chǔ)設(shè)施支撐數(shù)據(jù)要素高效流通,幫助制造業(yè)生產(chǎn)直面消費市場,使生產(chǎn)制造方式從大規(guī)模、標準化、低成本的流水線生產(chǎn)向小規(guī)模、個性化、易調(diào)整的數(shù)字化生產(chǎn)方式轉(zhuǎn)變,使按需生產(chǎn)、快速響應(yīng)、各生產(chǎn)環(huán)節(jié)之間的緊密配合成為可能,衍生出增量制造、柔性制造等新模式。
面對價值互聯(lián)網(wǎng)的發(fā)展浪潮,在網(wǎng)絡(luò)強國戰(zhàn)略實施過程中,引領(lǐng)互聯(lián)網(wǎng)體系結(jié)構(gòu)和基礎(chǔ)技術(shù)方面的創(chuàng)新才是根本。為此,應(yīng)加快搭建數(shù)據(jù)基礎(chǔ)制度體系、制定有關(guān)技術(shù)標準,前瞻布局“數(shù)據(jù)中樞”模式沙盒試點,以積極作為的姿態(tài)把握第四次工業(yè)革命發(fā)展機遇,以網(wǎng)絡(luò)強國和數(shù)字中國建設(shè)推動實現(xiàn)經(jīng)濟和社會發(fā)展數(shù)字化轉(zhuǎn)型,以數(shù)字經(jīng)濟高質(zhì)量快速發(fā)展推動實現(xiàn)中華民族偉大復(fù)興的宏偉目標。
(作者為中國科學(xué)院計算技術(shù)研究所互聯(lián)網(wǎng)基礎(chǔ)技術(shù)實驗室主任,清華大學(xué)互聯(lián)網(wǎng)治理研究中心主任,伏羲智庫創(chuàng)始人)
【參考文獻】
①江小涓、靳景:《數(shù)字技術(shù)提升經(jīng)濟效率:服務(wù)分工、產(chǎn)業(yè)協(xié)同和數(shù)實孿生》,《管理世界》,2022年第12期。
②McCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J]. The bulletin of mathematical biophysics, 1943, 5: 115-133.
③李曉東、劉金河、付偉:《互聯(lián)網(wǎng)發(fā)展新階段與基礎(chǔ)資源全球治理體系變革》,《汕頭大學(xué)學(xué)報(人文社會科學(xué)版)》,2021年第8期。
責(zé)編/王妍卓 美編/宋揚
聲明:本文為人民論壇雜志社原創(chuàng)內(nèi)容,任何單位或個人轉(zhuǎn)載請回復(fù)本微信號獲得授權(quán),轉(zhuǎn)載時務(wù)必標明來源及作者,否則追究法律責(zé)任。