摘要:我國政務數據與包括企業(yè)數據在內的社會數據的融合研究,起步較晚且滯后于實踐。針對目前沒有兩類數據融合利用演進歷程研究,缺乏數據融合時具體形態(tài)分析,基于演化視角,通過將數據融合演進與經濟發(fā)展緊密融合,回溯工業(yè)經濟、后工業(yè)經濟、數字經濟時代數據融合過程,以案例研究、對比研究、演繹推理等方式,總結提煉并剖析政企數據融合利用1.0、2.0、3.0、4.0模式的內涵、特點及過程,提出每種模式對應的數據存在形態(tài)。研究發(fā)現(xiàn),未來四種模式將長期并存,新興的3.0、4.0模式將從權屬關系、存在形態(tài)、主體協(xié)同等方面,對未來政府數字治理產生深刻影響。
一、引言
習近平總書記在十九大后第二次中央政治局集體學習會上指出,“要加強政企合作、多方參與,加快公共服務領域數據集中和共享,推進同企業(yè)積累的社會數據進行平臺對接,形成社會治理強大合力”。這是中央層面首次提出推進政府數據與社會數據要素的平臺對接,形成政企一體化數據資源體系的政策要求。從全球范圍看,政務數據與社會數據融合利用最早起源于美國,20世紀70年代,美國聯(lián)邦政府便開始搜集政府部門業(yè)務數據、公民民意數據及自然環(huán)境數據,通過處理分析,為應對科技問題及挑戰(zhàn)提供數據參考。此后,美日韓等國家逐步認識到政務數據與社會數據融合利用的重要性,紛紛開展相關研究及實踐探索。近年來,政務數據及社會數據的巨大價值得到政產學研各界廣泛認同,數字政府打造、智慧社會建設、數字經濟發(fā)展、企業(yè)數字化轉型,都離不開兩類數據的開發(fā)利用及價值激活。隨著大數據戰(zhàn)略的加快推進,大數據產業(yè)蓬勃發(fā)展,融合應用不斷深化,我國大數據發(fā)展在快車道上不斷前行。目前,超過90%的省級政府制定了政務數據資源共享管理辦法,82個省級、副省級和地級政府上線了數據開放平臺,政務數據共享開放及分析利用取得了長足進步。然而,政務數據和社會數據對接機制缺失、對接范圍不廣、對接數據不足、對接應用不深等問題普遍存在,特別是企業(yè)尤其是互聯(lián)網巨頭擁有的海量企業(yè)數據,難以被政府及社會利用,政企數據融合利用難成為政府數據與社會數據對接難的焦點。我國政務數據與社會數據的共享利用還處于起步階段,數據潛在巨大價值尚未激活,如何實現(xiàn)黨中央提出的“統(tǒng)籌規(guī)劃政務數據資源和社會數據資源”“加快公共服務領域數據集中和共享,推進同企業(yè)積累的社會數據進行平臺對接”,是我國數字治理必須要著力解決的重大問題。
二、研究述評
我國學者關于政務數據與企業(yè)數據融合利用的研究相對較少,理論研究滯后于實踐探索。已有研究主要集中在重要性闡述、理論探討、案例研究等方面。一是重要性方面研究。王曉明、夏義堃、趙樹寬等基于不同研究視角,提出政府數據與企業(yè)等社會數據融合,可以增強政府數據調控能力、輔助支撐政府決策、有助于釋放更多數據紅利。二是理論方面的研究。錢國富、連玉明、安小米等分別從本體論、“塊數據”理論、協(xié)同創(chuàng)新理論等視角,開展了兩類數據的關聯(lián)性及管理機制。三是案例方面的研究。馬廣惠等圍繞治理主體、治理客體、治理工具三個維度,對大數據匯聚、融合、應用進行了案例分析。崔佳佳等聚焦中小企業(yè)融資,研究了破解融資難的機制及經驗。目前,在政企數據融合利用領域的研究,存在兩方面不足。一是缺乏整個發(fā)展脈絡研究。相關文獻主要集中于近五年,對我國政務數據與企業(yè)數據融合利用的演進歷程、發(fā)展特點、未來發(fā)展趨勢未做梳理總結。二是缺乏數據融合具體形態(tài)研究。已有的數據融合利用研究,直接闡述對數據進行了加工分析,應用到政府決策或民生服務,而很少涉及數據是如何進行加工處理、融合時是以原始數據還是脫敏數據抑或是數據標簽。鑒于此,本文將基于演化視角,聚焦社會數據中最為重要的企業(yè)數據,對我國政務數據與企業(yè)數據融合利用進行全面梳理,提煉形成代表性的融合模式;同時,研究政企數據在每種模式下的存在狀態(tài),以期為今后開展多類數據融合利用研究提供參考依據。
三、政企數據融合利用演進歷程
我國政務數據與企業(yè)數據的融合利用,與經濟發(fā)展階段密切相關,反映了數據與經濟之間的有機關聯(lián),體現(xiàn)了數據作為經濟發(fā)展關鍵要素而越發(fā)重要的特點。隨著我國經濟形態(tài)由工業(yè)經濟、后工業(yè)經濟向數字經濟邁進,政務數據與社會數據對接融合的種類數量、對接程度、應用領域、價值實現(xiàn)不斷增強,表現(xiàn)出4個典型的演進階段。(一)1.0融合模式1.0融合是指政府以行政方式獲取企業(yè)數據的模式。包括例行上報和應急上報兩種類型。在工業(yè)經濟時代,數據主要作為統(tǒng)計分析使用,通過獲取企業(yè)數據并與政務數據融合,可以幫助政府了解行業(yè)發(fā)展情況及總體經濟運行狀況,企業(yè)數據是政府研判經濟形勢的重要參考。這一時期,企業(yè)對數據的敏感度關注并不高,數據價值的開發(fā)處于較低水平,企業(yè)愿意將數據提供給政府使用。政府通常以法律法規(guī)形式,讓企業(yè)按要求上報月度數據、季度數據、年度數據等,上報的方式既可以是紙質材料、電子材料或電話溝通,也可以通過企業(yè)與政府間的專有渠道。政府與企業(yè)間的數據流動,主要是單向的,即從企業(yè)流向政府,而政務數據則較少共享給企業(yè)。在此模式下,企業(yè)的各種統(tǒng)計業(yè)務分別由不同的部門負責,分別向主管領導呈送并對外報出,流程復雜、效率低下,無法應對突發(fā)事件的發(fā)生,需要其他類型進行補充。第二種類型是指應急性上報,作為第一種模式的補充。工業(yè)經濟時代后期,經濟活躍度逐步增強,經濟領域突發(fā)事件頻發(fā),僅靠行政手段讓企業(yè)按時提供常規(guī)數據的方式,已無法滿足政府引導、干預經濟的需求。為此,在常規(guī)例行上報數據之外,需要額外增加上報數據,以幫助政府掌握突發(fā)經濟事件的影響,為干預處理提供數據決策參考。例如,面對社會熱點事件,市場監(jiān)管總局積極協(xié)調不同企業(yè),要求企業(yè)迅速上報相關數據供分析人員進行分析并形成專題報告,為事后監(jiān)管、責任追查形成良好鋪墊。相對第一種類型,應急上報模式時間上更加急迫、政府干預力度更大,企業(yè)上報數據也不限于經營數據,也會包括突發(fā)事件中的就業(yè)失業(yè)數據、減產數據、損失數據、安全數據等。然而,這兩種類型的模式都是傳統(tǒng)的數據收集模式,政府的數據是按照特定研究目的、抽樣方案、記錄方式獲得的格式化的數據,不僅數據量有限,數據質量也難以保證,通常無法滿足多層次、多角度的需要,因此,需要更高類型的數據融合模式進行彌補。(二)2.0融合模式進入后工業(yè)時代,企業(yè)逐步向信息化、數字化轉型,業(yè)務及生產經營數據變化速度加快。政府治理能力面臨挑戰(zhàn),需要對企業(yè)所有生產活動和業(yè)務活動數據進行準確及時的分析,利用大數據提升科學決策能力、社會監(jiān)管能力、公共服務能力和應急管理能力。2.0模式是指政社數據以接口方式進行融合應用。這種模式也分為兩類,一類是數據的比對核驗,另一類是API授權方式。比對核驗方式是目前政府向社會開放數據的延伸,是將政府內部的查詢核驗數據的功能拓展到了社會領域。為確保數據安全,政務數據在和社會數據對接時,通過政府或企業(yè)平臺進行聯(lián)通,將數據需求申請發(fā)送政府或企業(yè)數據共享平臺,由平臺對數據進行核驗后給出驗證結果。API方式通常用于政府或事業(yè)單位獲取企業(yè)數據,通過API調用企業(yè)數據,將其與政務數據進行融合,然后進行開發(fā)利用,這種方式確保了數據安全,企業(yè)是無法接觸到政府數據的。以數據比對核驗為例進行說明。為解決小微企業(yè)融資難問題,山東省政府打通部門內部數據孤島,促進政務數據與銀行數據進行對接共享,極大提升了企業(yè)貸款成功率和辦理效率(參見圖1)。山東省級政府首先將市場監(jiān)管局、稅務局、發(fā)改委、環(huán)保廳、農業(yè)廳所掌握的企業(yè)信息、納稅信息、信用信息、環(huán)保處罰信息、土地確權辦證信息,通過省級共享交換平臺進行共享,并通過國家共享交換平臺進行信用數據、個人數據核驗,驗證通過之后,將數據推送給各商業(yè)銀行,由銀行依托各自數據平臺對所有政務數據與自身掌握的企業(yè)數據進行對接,核驗校對成功后即可批準個人貸款辦理申請。在這種模式下,政府數據和企業(yè)數據通過銀行的數據平臺進行了對比驗真。
圖1 個人貸款申請業(yè)務場景下政企數據平臺化對接機制
(三)3.0融合模式3.0模式是指政企數據通過模型算法進行融合利用。進入數字經濟時代,政府及企業(yè)產生的數據呈指數級增長,數據從簡單的處理對象開始轉變?yōu)橐环N基礎性資源,數據治理方式面臨巨大變革。企業(yè)深度參與、數據雙向融合利用是3.0模式區(qū)別于前兩種模式的主要特點。隨著數據多源異構動態(tài)增長,政府已難以獨立分析處理這些數據,需要借助外部力量協(xié)助。具有豐富數據分析經驗的企業(yè)將成為數據融合分析的主力軍,數據處理利用主導權將從政府主導逐漸向企業(yè)主導轉變,企業(yè)會在政府指導下開展數據加工分析,形成數據分析結果支撐政府決策。同時,由于模型算法只是一種技術手段,不存在數據隱私泄漏的問題,政務數據與社會數據可以在政企之間雙向流動。3.0模式共享的數據既不是原始數據,也不是脫敏數據,而是對數據進行處理的模型算法,“即數據不見面、模型算法見面”。目前,3.0模式成為企業(yè)開展政務數據與社會數據對接的主要模式,國內的商湯科技、曠視科技、數聯(lián)銘品等大數據領軍企業(yè),都已在數據模型算法應用領域取得積極成效。企業(yè)可通過設計模型算法,置于政府數據平臺上進行模型訓練,在不共享政府數據的前提下,獲取數據運算結果以支撐業(yè)務開展。例如,商湯科技在與公安部門合作開展人臉識別時,在經公安部門授權許可之后,將研發(fā)的模型算法放入公安部門內網,利用所需場景數據進行模型訓練和優(yōu)化,通過基于大數據訓練的深度學習模型,對眨眼、張嘴、點頭等人臉表情數據進行抓取和學習,并與公安部人臉數據進行比對,確保人臉身份認證結果的準確。(四)4.0融合模式4.0模式是指數據以抽象化的特征形式進行融合利用的模式。長期以來,政府掌握的數據遠遠超過社會數據,但隨著5G、物聯(lián)網等新一代信息技術的廣泛應用,大量社會數據將隨之產生,社會數據量將逐步超過政府數據。社會數據的增長速度、價值量也有望超過政府數據。在此情形下,數據的加工處理復雜性、專業(yè)性更高,更加需要專業(yè)化的團隊承擔,以在保障滿足技術需求的同時兼顧政府目標的實現(xiàn)??紤]到海量數據的安全問題,數據必須進行脫敏處理后才可以應用,同時,考慮到應用場景急劇增加,同樣的數據將應用到不同的領域并和不同數據進行融合對接,能夠同時滿足這些條件的數據存在方式,最佳選擇為數據的標簽化,通過數據標簽進行政務數據與社會數據的對接利用。為提升海量異類標簽對接的效率,將會依據原始數據產生大量專題特征庫,作為標簽儲存的載體。4.0模式將成為未來政社數據融合利用的新模式。比如,在建設全國一體化國家大數據中心時,通過清理、整合、統(tǒng)籌政府部門相關數據以及社會數據,結合業(yè)務應用需求,聚焦個人、企業(yè)等主體,挖掘數據的共性、普遍性的本體特征,形成面向行為規(guī)律、業(yè)務邏輯的數據標簽體系和主題庫等“數據半成品”,進而形成支撐各級政府決策履職和服務社會相關機構的大數據主題資源庫,使數據以“數據特征對數據特征”“主題庫對主題庫”方式對接,為開展重大風險防控、區(qū)域協(xié)調發(fā)展、宏觀經濟運行、社會應急管理、公共服務優(yōu)化等提供數據決策支撐。在國家大數據中心體系中,國家、部委、省級、市級、區(qū)縣五個層面的政務數據,將依托數據平臺,對個人身份、企業(yè)法人等基礎數據,以及教育學歷、婚姻狀況、健康醫(yī)療等主題數據進行加工處理,形成政務數據標簽、數據特征、數據特征庫。同時,從互聯(lián)網數據、企業(yè)數據、感知數據三個維度,依托大數據平臺,將社會數據形成社會數據標簽、數據特征、數據特征庫,數據的融合利用以數據特征的方式進行(參見圖2),為開展大數據聯(lián)合分析應用、提高信息資源利用水平提供基礎,充分發(fā)揮大數據提升國家治理能力的作用。政務數據與企業(yè)數據融合利用模式對比分析參見表1。
圖2 4.0融合模式中政務數據與社會數據對接機制
表1 政務數據與企業(yè)數據融合利用模式對比分析
四、政企數據融合利用的雙維度分析
數據不整合,就發(fā)揮不出大價值。政務數據與企業(yè)數據融合利用模式的演進,取決于數據數量及價值的變化,在技術的可實現(xiàn)性及社會各方需求的帶動下,隨著數量及價值增加,數據融合利用模式從1.0向4.0演進。在此過程中,隨著數據數量及價值的變化,將會出現(xiàn)4個臨界點和2個奇點。(一)數據融合的數量維度分析回顧半個多世紀人類信息社會發(fā)展歷史,處理各種不斷增長的數據都是社會的挑戰(zhàn)和難題。從數據數量維度看,隨著社會的發(fā)展,數據量將迅猛增長,國際數據公司(IDC)預測,2018年,中國約產生7.6ZB的數據,還將保持每年30%的增長,到2025年的數據量將達到48.6ZB。數據的猛增,將帶來兩個量變到質變的轉變:一是數據量超過政府處理能力范圍,海量的政府及社會數據將由政府處理轉變?yōu)橛缮鐣C構處理,政府指導、市場化運作成為必然選擇,這個臨界點即市場化臨界點;二是政務數據和社會數據比例方面,隨著物聯(lián)網技術的廣泛部署和使用,社會數據將逐步超過政府數據,政務數據、社會數據比例將發(fā)生倒轉,這個臨界點即比例臨界點。(二)數據融合的價值維度分析隨著數量的增加,數據價值也會隨之增長,成為政府及企業(yè)的一類重要資產,數據資產化的屬性將會愈發(fā)明顯,推動數據資產價值鏈由低端向高端演進。由于數據具有公共價值屬性,可以同時在多個領域應用,而且其價值也將越來越大。隨著技術進步,數據存儲、數據清洗挖掘將實現(xiàn)規(guī)?;\營,成本得以降低,而數據的價值則隨著數量的增加不斷上升,當數據本身的價值大于數據處理成本時,企業(yè)便有了收益為保障,數據真正成為企業(yè)核心資產,大量專業(yè)化的數據型公司將爆發(fā)式增長,綜合提供數據,推動數據應用、整合數據加工的新型公司將具備明顯競爭優(yōu)勢,此臨界點即收益臨界點。進一步發(fā)展,將會遇到一個臨界點,即數據在各領域的總體應用價值大于其在某一領域的價值,為了更好地服務其他領域的應用,其存在形式就要根據使用領域而定,考慮到各應用領域的數據存在形式往往有差異,但總會有一個最小公約數,為了提高數據應用效率,數據將按照最小公約數的要求進行標簽化,形成共性的、滿足各種應用的存在形式,此即存在臨界點。在此臨界點,通過數據標簽化,解決了原始數據共享的隱私及安全隱患。(三)數據融合的雙維度奇點分析在4個臨界點的交點處,會形成2個奇點。一是萬物數化的奇點,即市場臨界點和收益臨界點對應的位置。在這個奇點,數字成為社會萬物存在的主要形態(tài),物質本質越發(fā)表現(xiàn)為數字化,政府將把數據的運營交給專業(yè)的數字化公司,企業(yè)通過數據不見面、模型算法見面的方式,將政務數據與企業(yè)數據進行對接融合,開發(fā)新產品和服務,滿足政府和社會的需求。二是萬物智聯(lián)的奇點,即比例臨界點和存在臨界點對應的位置。這個階段數據融合的模式,將克服只有模型算法見面的制約,不同應用場景并不需要單獨開發(fā)不同的模型算法,各數據使用方均可通過具有共性的數據特征進行政務數據和社會數據的融合利用,數據完成了標簽化存在,同時,萬物數化也隨之晉級為萬物智聯(lián)(參見圖3)。
圖3 數據對接的代際演進模型
五、啟示及展望
我國政務數據與社會數據融合利用表現(xiàn)出的4種模式,特點鮮明,均有適用的場景,短期內,單一模式難以完全滿足政府和社會的實際需求,4種模式將并存共用。面向未來,隨著數據規(guī)模井噴式擴張、數據應用場景爆發(fā)式增長且安全問題越發(fā)突出,各類數據的權屬關系、存在形態(tài)、主體協(xié)同以及新興技術應用,都將發(fā)生顯著變化。(一)不求所有但為所用成為新趨勢當前,大數據的發(fā)展仍然面臨著許多問題,安全與隱私問題是人們公認的關鍵問題。因此,如何保護個人隱私、商業(yè)機密及國家數據安全,將成為政務數據與企業(yè)數據融合利用的重要議題。由于直接使用原始數據會存在巨大的安全風險,對脫敏后的數據進行分析利用將成為主流,即數據的使用權可以轉移,而原始數據的所有權還屬于數據擁有的主體,企業(yè)可以利用政府數據,但不能拿到政府掌握的原始數據,即政務數據可為企業(yè)所用但不可為企業(yè)所有。(二)政社數據融合涌現(xiàn)新形態(tài)隨著社會數據量的增加,政府數據的數量甚至價值占比將降低,政企數據融合,將從企業(yè)數據向政務數據歸攏轉向政務數據向企業(yè)數據匯聚,企業(yè)將成為數據加工處理的主力軍,數據融合利用模式將以3.0和4.0模式為主。數據融合時的形態(tài),也將會從簡單的脫敏狀態(tài)變?yōu)楦呃脙r值的知識圖譜,即標簽化、特征化、場景化知識圖譜形式存在,政務數據及社會數據將經過標簽化處理之后對接融合,然后再進行統(tǒng)一的增值開發(fā)利用。(三)政企合作多元共治新變革隨著數據融合模式的轉變,1.0、2.0模式時政府主導的地位將會改變,法律法規(guī)及行政手段的主要適用范圍將進一步固化到特定領域。隨著3.0及4.0融合模式的到來,政府應當更多地注重共性標準制定及政企合作機制的建立,確保政府數據治理的安全性。企業(yè)在大數據時代將因為擁有更多更好的數據,特別是擁有明確的目標及出色領導機制,更容易獲得成功。政府將對企業(yè)處理數據進行引導和規(guī)范,隨著業(yè)務關聯(lián)性的增強和規(guī)范力度的加強,企業(yè)將會體現(xiàn)一定的政府意志,一種同時兼顧政府治理功能和企業(yè)市場化屬性的新型組織將會產生,政務數據與社會數據的融合利用工作由新型組織承擔。至此,大數據驅動下的政府治理結構,將由政府一元主導模式轉變?yōu)檎c多種社會力量合作的多元共治模式,形成多中心、開放型的網絡治理結構。(四)新技術驅動人機交互發(fā)展新方向海量數據的采集、存儲、清洗、加工、共享、交易、利用等全鏈條,都需要新一代信息技術的支撐,政務數據與社會數據融合利用對技術的依賴性將增強。信息技術體系將完成蛻變升華式的重構,將使蘊含在大數據中的巨大價值得以充分釋放,物聯(lián)網、5G、移動互聯(lián)網技術將在數據采集、存儲中廣泛應用,大數據、人工智能將為海量數據的快速分析處理提供強有力的工具,區(qū)塊鏈技術也可以在數據安全方面發(fā)揮重要作用,新一代信息技術將為政務數據與社會數據融合利用提供必不可少的支撐,人機交互、以人為本、服務于民將是未來下一代新技術發(fā)展的新方向。
作者:國家信息中心大數據發(fā)展部郭明軍、王建冬;中國人民大學安小米;國家信息中心大數據發(fā)展部李慧穎;北京大學張何燦 ( 本文刊載于《電子政務》2020年第3期)