摘 要:數(shù)據(jù)作為人工智能和大數(shù)據(jù)時代的核心要素,將對人類社會發(fā)展帶來深刻影響。隨著數(shù)據(jù)容量的快速積累、算力和數(shù)據(jù)質量的不斷提高,如何使用和管理數(shù)據(jù)成為第四次工業(yè)革命中一個重要的課題。人工智能背景下的數(shù)據(jù)治理,需要準確把握挖掘數(shù)據(jù)潛在價值、降低數(shù)據(jù)利用成本和控制數(shù)據(jù)隱含風險的總目標,并從治理原則、制度體系和場景管理等方面著力,推動數(shù)據(jù)治理實踐的落地落實。
關鍵詞:數(shù)據(jù)治理 人工智能 大數(shù)據(jù)
【中圖分類號】F49 【文獻標識碼】A
數(shù)據(jù)治理的背景
人類利用數(shù)據(jù)的歷史非常悠久,很早就掌握利用數(shù)字記錄、管理生產(chǎn)生活的能力。19世紀初,一些博物學家在私人資助下環(huán)游世界搜集動植物標本、觀測天文現(xiàn)象,并通過規(guī)?;涗洈?shù)據(jù)從紛繁復雜的事實中歸納科學發(fā)現(xiàn)。由此,數(shù)據(jù)開始真正被社會關注、規(guī)范和監(jiān)管,并逐漸被制度化為社會商品。歐洲的霍亂疫情使得人們開始搜集、統(tǒng)計疾病傳播的數(shù)據(jù),并發(fā)明了可視化技術和數(shù)據(jù)分析方法。進入20世紀之后,貿(mào)易需求促進了測量和計算方法的發(fā)展,統(tǒng)計學成為一門獨立學科,為應對數(shù)據(jù)分析的需求,軍事投入也推動了計算科學的進步以及數(shù)據(jù)傳輸技術的發(fā)展。今天,互聯(lián)網(wǎng)公司如Facebook、亞馬遜、騰訊、阿里巴巴等管理著數(shù)十億人的工作、娛樂、消費等數(shù)據(jù),我們現(xiàn)在所談論的數(shù)據(jù),已經(jīng)是人工智能時代海量的數(shù)據(jù)資源——大數(shù)據(jù)??v觀人類利用數(shù)據(jù)的歷史,在制度、技術和經(jīng)濟發(fā)展的交織作用下,數(shù)據(jù)的規(guī)模、價值和影響不斷擴大,影響日益深遠。如今,數(shù)據(jù)作為一種生產(chǎn)要素,作為信息時代的“石油”,已然取得與農(nóng)業(yè)時代的土地、工業(yè)時代的資本同樣重要,甚至是更加突出的地位。
數(shù)據(jù)治理包括利用數(shù)據(jù)進行治理和對數(shù)據(jù)進行治理兩個含義。前者將數(shù)據(jù)作為一種技術手段應用到治理實踐中,與電子政務、電子商務等密切相關,目前已經(jīng)有很多的研究;后者則將數(shù)據(jù)視作治理對象,關注數(shù)據(jù)特性、數(shù)據(jù)應用和數(shù)據(jù)管理。在人工智能和大數(shù)據(jù)快速發(fā)展的背景下,對這方面概念、理論和政策的梳理還比較欠缺,應是未來研究的重要方向。數(shù)據(jù)治理的兩個含義相互聯(lián)系,但并不沖突。一方面,政務APP、一站式服務等改革舉措通過讓“讓數(shù)據(jù)多跑路、讓群眾少跑腿”,極大提高了公共服務的效率和滿意度。另一方面,無論是在公共部門還是私營部門,數(shù)據(jù)的應用和管理問題,已經(jīng)日益成為現(xiàn)實生活中至為重要的議題。
數(shù)據(jù)治理的必要性
隨著大數(shù)據(jù)、人工智能、共享經(jīng)濟、平臺經(jīng)濟等新技術、新業(yè)態(tài)的迅速發(fā)展,人們在社交網(wǎng)絡中展現(xiàn)出的個人行為、性格偏好、興趣愛好都可以被數(shù)據(jù)化,通過特定算法生成“數(shù)據(jù)畫像”,每個人都將變成沒有隱私的“透明人”。在沒有外部規(guī)制的條件下,商家可以根據(jù)消費者的個人偏好向其推薦特定商品或服務,并根據(jù)消費者的收入水平、消費傾向“因人定價”,通過“大數(shù)據(jù)殺熟”等方式實現(xiàn)利潤最大化。同時,互聯(lián)網(wǎng)平臺企業(yè)存在用戶數(shù)據(jù)泄露隱患,導致個人隱私保護更加困難。僅在 2018年Facebook就發(fā)生三次嚴重的數(shù)據(jù)泄露事件。以上問題表明,數(shù)據(jù)在成為一項重要的社會資源的同時,其使用和監(jiān)管也面臨很多新的挑戰(zhàn),需要我們從數(shù)據(jù)保護、獲取和利用等多維視角,以及法律、制度和政策等不同層面對其進行系統(tǒng)研究,以便更好地開發(fā)其價值,同時控制其潛在的風險。
數(shù)據(jù)治理的目標
無論是當前的理論研究還是實踐探索,尚未形成數(shù)據(jù)治理的準確定義。一般認為數(shù)據(jù)治理是對數(shù)據(jù)行使管理權力的過程,具體而言有四個方面的內涵。首先,數(shù)據(jù)治理是一個跨功能的活動,需要跨越不同的功能邊界和學科領域;其次,數(shù)據(jù)治理將數(shù)據(jù)視作一種重要的戰(zhàn)略資產(chǎn),為管理數(shù)據(jù)提供一種結構化和形式化的框架;第三,數(shù)據(jù)治理回答了數(shù)據(jù)管理需要什么樣的決策,如何形成這種決策,誰有權做出這種決策等問題;最后,數(shù)據(jù)治理需要建立數(shù)據(jù)政策、標準和流程,還需要監(jiān)管合規(guī),確保政策和標準能夠執(zhí)行。
數(shù)據(jù)治理的目標是充分挖掘數(shù)據(jù)潛在的價值,同時盡可能降低數(shù)據(jù)利用的成本和控制可能產(chǎn)生的風險,這三者之間需要保持統(tǒng)籌與平衡,不可偏廢任何一方。數(shù)據(jù)治理在宏觀層面包括國際、國內和有關部門的法律、政策和條例;中觀層面包括組織的數(shù)據(jù)治理,以實現(xiàn)數(shù)據(jù)的價值和防范風險為目標;在微觀層面關注日常數(shù)據(jù),依靠相關專業(yè)人士處理數(shù)據(jù)信息。按照治理對象種類的不同,可以將數(shù)據(jù)區(qū)分為以下大類:科研數(shù)據(jù)、公共數(shù)據(jù)、商業(yè)行為數(shù)據(jù)和個人隱私數(shù)據(jù)等,而不同類型的數(shù)據(jù),在不同應用場景下,需要不同的治理規(guī)則。
數(shù)據(jù)治理的實現(xiàn)路徑
本質上看,數(shù)據(jù)治理是追求公共利益最大化的社會治理過程,因此,首先需要明確數(shù)據(jù)治理的基本原則。數(shù)據(jù)的所有權屬于誰?數(shù)據(jù)應該由誰來管理?數(shù)據(jù)使用中如何保障個人權益?哪些數(shù)據(jù)需要促進開放和流動?目前這一系列問題都需要進一步討論。
其次,根據(jù)數(shù)據(jù)保護的實際情況,加強數(shù)據(jù)治理的制度建設。歐盟于2018年出臺了被視為“史上最嚴”的數(shù)據(jù)保護法規(guī)——《通用數(shù)據(jù)保護條例》(GDPR),對個人信息的保護達到前所未有的高度,將數(shù)據(jù)披露與使用的權利賦予個人,同時明確數(shù)據(jù)控制者與數(shù)據(jù)處理者有保護個人數(shù)據(jù),以及加工處理以防止泄密的義務。然而,不少學者認為歐盟的這種過度保護措施,會使其喪失數(shù)字產(chǎn)業(yè)未來的競爭力。對此,中國應當辯證地學習和借鑒歐盟的經(jīng)驗,并結合中國發(fā)展實際,加快構建隱私權保護的法律,明確數(shù)據(jù)權屬以及隱私保護規(guī)則,在產(chǎn)業(yè)發(fā)展與人民權益保護之間建立平衡。
再次,數(shù)據(jù)治理是政府、企業(yè)和用戶等多元主體對數(shù)據(jù)采取聯(lián)合行動的過程,如何協(xié)調利益訴求不一致甚至相互沖突的多元主體是數(shù)據(jù)治理的關鍵。鑒于數(shù)據(jù)多元主體的現(xiàn)狀,需要構建“多方參與,分層監(jiān)管,合理擔責”的治理體系。促進政府部門開放相應的數(shù)據(jù),打通不同部門之間“數(shù)據(jù)孤島”。與此同時,政府與平臺企業(yè)可以聯(lián)合,也可以委托第三方機構建立違法內容共享數(shù)據(jù)庫,比如假冒侵權數(shù)據(jù)庫、低俗圖片和視頻庫、違法信息數(shù)據(jù)庫、判定規(guī)則數(shù)據(jù)庫等,勾勒出常見違法內容的主要特征,便于平臺企業(yè)利用人工智能等技術手段自動識別和判定疑似違法內容,更好履行審查義務。
最后,根據(jù)數(shù)據(jù)種類的不同,需要做到精細化分類管理的要求,將宏觀數(shù)據(jù)治理規(guī)則精確體現(xiàn)到具體的應用場景中,充分發(fā)揮數(shù)據(jù)的作用,挖掘其價值。應當注意的是,數(shù)據(jù)的有效治理離不開數(shù)據(jù)技術的幫助,新興技術在發(fā)展過程中產(chǎn)生的問題還需要技術本身來解決。例如,在設計數(shù)據(jù)共享機制時,可以對數(shù)據(jù)進行分類,明確哪些數(shù)據(jù)在何種情況下可以進行共享,以及相應的保護和懲罰措施。同時,把數(shù)據(jù)的有限開放和完全開放相結合。對于涉及個人信息的數(shù)據(jù),可以通過開設許可證或開放數(shù)據(jù)接口進行驗證等方式有限地開放。而對于那些不涉及個人隱私的公共服務數(shù)據(jù),比如環(huán)保、交通、氣象等領域數(shù)據(jù),則應當在保證安全的基礎上全面開放。
總體而言,物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等新興技術的發(fā)展加速了人類文明數(shù)字化的進程,同時給數(shù)據(jù)治理帶來了新問題和新挑戰(zhàn)。為了充分挖掘大規(guī)模數(shù)據(jù)應用的經(jīng)濟社會價值,降低數(shù)據(jù)利用的成本和風險,亟需構建全面、合理、平衡的數(shù)據(jù)治理體系,在各利益相關者取得共識的基礎上明確數(shù)據(jù)治理的原則,建立數(shù)據(jù)治理的制度和法律體系,協(xié)調政府、企業(yè)和用戶在數(shù)據(jù)使用中的關系,分類管理數(shù)據(jù)應用的具體場景和環(huán)境。
【本文作者為清華大學公共管理學院教授、清華大學人工智能國際治理研究院副院長;清華大學公共管理學院博士后吳培熠對本文亦有貢獻】
責編:羅 婷 / 王茂磊
聲明:本文為《國家治理》周刊原創(chuàng)內容,任何單位或個人轉載請回復國家治理周刊微信號獲得授權,轉載時務必標明來源及作者,否則追究法律責任。