幾年前,大數(shù)據似乎還是科學家才會關心的事,但如今,它已觸手可及。
責任編輯:admin
例如,著名職場社交網站LinkedIn公布的2014年最受雇主喜歡、最炙手可熱的25項技能中,統(tǒng)計分析與數(shù)據挖掘位列榜首。而研究機構Gartner預測,2015年,全球將新增440萬個與大數(shù)據相關的工作崗位,25%的組織將設立首席數(shù)據官一職。
政府機構同樣正經歷深刻的變化。今年5月,曾在LinkedIn、eBay、Skype等硅谷公司任職的帕蒂爾(DJ Patil)被奧巴馬任命為白宮首位首席數(shù)據官和制定數(shù)據策略的副首席技術官。這一史上最榮耀的IT職位旋即吸引無數(shù)關注。
與之相對,最近兩年,國內不少地方政府也趕起了“時髦”,開始建立全新的政府職能機關—大數(shù)據管理局。如果用更接地氣的稱呼,這些局長也就是當?shù)氐氖紫瘮?shù)據官。
據了解,這些新生機構目前大多承擔著組織制定數(shù)據收集、管理、開放、交易、應用等標準規(guī)范、推動政府數(shù)據開放、推進大數(shù)據產業(yè)發(fā)展等方面的職責,但目前還沒有很多落地的動作。
而9月初,國務院印發(fā)《促進大數(shù)據發(fā)展行動綱要》(以下簡稱《綱要》),系統(tǒng)部署大數(shù)據發(fā)展工作?!毒V要》指出,2018年底前,要建成國家政府數(shù)據統(tǒng)一開放平臺,率先在信用、交通、醫(yī)療等重要領域實現(xiàn)公共數(shù)據資源合理適度向社會開放。
有業(yè)內人士接受時代周報記者采訪時認為,各地建立大數(shù)據管理局,其實正是對國務院要求發(fā)展大數(shù)據的提前響應。既然如此,這些新生機構準備如何推動中國的大數(shù)據產業(yè)發(fā)展呢?
由政府牽頭推動大數(shù)據產業(yè)
9月1日,成都市經濟與信息化委員會的網站上掛出一則《關于成立“成都市大數(shù)據管理局”籌備組的通知》。這份公告顯示,成都市委編委2015年第2次會議決定,批準在該市經信委下設立大數(shù)據管理局。
大數(shù)據管理局的名字聽上去頗為新鮮,但這已不是國內首家。此前,廣東、遼寧等省均有地方政府率先試水。
據了解,大數(shù)據管理局的提法最早出現(xiàn)在2014年1月的中共廣州市委十屆五次全會上,成立這個“局”的目的是為統(tǒng)籌推進政府部門的信息采集、整理、共享和應用,消除信息孤島,建立公共數(shù)據開放機制。
這一構想很快得到立法支持。1個月后,廣東省政府印發(fā)《廣東省經濟與信息化委員會主要職責內設機構和人員編制規(guī)定》,其中明確提及成立廣東省大數(shù)據管理局。
此后,當年5月,廣東佛山南海區(qū)掛牌成立數(shù)據統(tǒng)籌局;沒過多久,廣東清遠在其經濟與信息化局的“三定方案”(定機構、定職權、定人員)中要求設置大數(shù)據管理科。
而到今年5月,廣州市政府公布工信委、商務委、國資委3個部門的“三定方案”。根據方案,廣州市工信委設立直屬行政單位廣州市大數(shù)據管理局,主要負責研究擬訂并組織實施大數(shù)據戰(zhàn)略、規(guī)劃和政策措施,引導和推動大數(shù)據研究和應用工作;組織制定大數(shù)據收集、管理、開放、應用等標準規(guī)范等9項職責。
按照規(guī)定,這個正處級單位內設3個科室,分別為規(guī)劃標準科、數(shù)據資源科(視頻資源管理科)與信息系統(tǒng)建設科,同時,配備行政編制15名,包括局長(副局級)1名,副局長(副處級)2名。
幾天后,遼寧沈陽亦快馬加鞭地建立了大數(shù)據管理局,級別為正局級,同樣下設3個部門—大數(shù)據產業(yè)處、標準與應用處和數(shù)據資源處。而之所以說“快馬加鞭”,該單位從組建到掛牌,前后只用了短短兩個多月。
不止如此,公開報道顯示,上海市政府也有建立大數(shù)據局的構想,但目前尚在研究階段。
而在今年6月習近平總書記曾前往考察大數(shù)據產業(yè)發(fā)展情況的貴州省,有知情人士對時代周報記者披露,“貴州也有建設大數(shù)據管理局的模塊,但當?shù)氐目紤]是,希望大數(shù)據產業(yè)發(fā)展成熟后再規(guī)劃大數(shù)據局進行統(tǒng)籌、管理,而在大數(shù)據發(fā)展期,這個產業(yè)需要省委省政府從大局上進行推動”。
幾乎一夜之間,全國多地的政府組織架構中都出現(xiàn)大數(shù)據管理局。“目前,各地都逐步意識到政府數(shù)據公開的社會價值與商業(yè)價值,于是紛紛成立大數(shù)據管理局,由之牽頭,推動當?shù)氐拇髷?shù)據產業(yè)發(fā)展。”貴陽大數(shù)據交易所執(zhí)行副總裁王亞川告訴時代周報記者。
而易觀智庫分析師認為,各地成立大數(shù)據管理局是為響應國務院對發(fā)展大數(shù)據的要求。而《綱要》出臺后,各級政府肯定會作出更多回應,“成都此次應該是提前布局了”。
“其實,不管是廣東省委書記胡春華,還是貴陽市委書記陳剛,這幾個率先嘗試成立大數(shù)據局的地區(qū),他們的領導有一個共同點—都從北京出來,而且,到地方之前都已經有發(fā)展大數(shù)據產業(yè)的成熟想法。”上述知情人士表示。
開放數(shù)據將帶動創(chuàng)新產業(yè)
對于順應潮流而生長的大數(shù)據管理局,很多人非常好奇,這個機構究竟要做些什么?它與已有的統(tǒng)計局又有何不同呢?
按照王亞川的觀察,各地政府目前擁有的數(shù)據可以分為兩類:政務數(shù)據和政府數(shù)據。統(tǒng)計局偏向收集政務數(shù)據,通常都是數(shù)字,比如經濟指標;而大數(shù)據管理局的主要對象是政府數(shù)據—政府在行政審批、非政府審批、服務事項等方面留存的數(shù)據,其中包括一些非標準化的文字數(shù)據。
而亞信數(shù)據副總裁鄒明達告訴時代周報記者,統(tǒng)計局與大數(shù)據管理局的目標與定位有著天然的差別。首先,前者通過各級政府統(tǒng)計、申報、匯總獲得結構化數(shù)據,后者則通過城市的政務信息化、社會信息化、產業(yè)信息化的全面推進,提取結構多樣的海量業(yè)務數(shù)據、過程數(shù)據、行為數(shù)據并進行匯總、加工、分析、挖掘;而且,拿到數(shù)據后,前者運用于決策或指數(shù)發(fā)布,而后者要做的是最大程度地發(fā)揮數(shù)據的社會服務或商業(yè)價值;此外,從數(shù)據量級來看,后者處理的才是真正的大數(shù)據。
“大數(shù)據管理局目前急需行使的主要職能包括,其一,消除數(shù)據孤島,將散落在各個委、辦、局的政府數(shù)據匯集起來,形成全省或全市的數(shù)據中心;其二,通過政府立法等制度建設,對各行各業(yè)如何安全使用數(shù)據進行有效監(jiān)管。”鄒明達說。
事實上,消除數(shù)據孤島只是第一步,大數(shù)據管理局更大的“野心”在于推動政府數(shù)據公開—時代周報記者梳理發(fā)現(xiàn),廣州、沈陽、成都三地對大數(shù)據管理局的職能設定中都有一句類似的表述:組織制定大數(shù)據收集、管理、開放、應用等標準規(guī)范。
而在《綱要》中,國務院重點部署三項主要任務。其中,首要任務便是,加快政府數(shù)據開放共享,推動資源整合,提升治理能力。
據了解,政府及相關部門如果能在收集、管理數(shù)據的基礎上開放數(shù)據,例如開放醫(yī)療數(shù)據、病例數(shù)據,這些數(shù)據的分析結果一旦服務于醫(yī)藥研究公司,那么釋放的將不僅是商業(yè)價值,還有巨大的社會價值。
目前,在政府數(shù)據開放上走得最前的貴州省已將醫(yī)療數(shù)據列入數(shù)據公開目錄。不過,貴州的政府數(shù)據計劃分三期開放,醫(yī)療數(shù)據不在首批之列。
“現(xiàn)在的企業(yè)大多只基于自己長期積累的數(shù)據做一些大數(shù)據業(yè)務,阿里巴巴設立的螞蟻金服就是一個典型案例。它利用天貓、淘寶的數(shù)據扶持自己的業(yè)務,但要想服務全國市場,僅僅依靠淘寶、天貓的數(shù)據是遠遠不夠的。所以,政府數(shù)據以及一些行業(yè)數(shù)據公開后,對于阿里巴巴來說,相當于打通了數(shù)據來源的壁壘,他們的業(yè)務將得到更好的支持。”王亞川說。
在他看來,開放政府數(shù)據對于產業(yè)發(fā)展的意義還在于,一些學者、學子以及初創(chuàng)型企業(yè)會在數(shù)據應用上創(chuàng)造出全新的商業(yè)模式,從而實現(xiàn)“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”。
其實,政府通過開放數(shù)據帶動商業(yè)發(fā)展在國外有過不少案例。比如,1983年,美國將衛(wèi)星定位系統(tǒng)從軍用轉為向公眾開放,結果帶動了一批創(chuàng)新企業(yè)的發(fā)展,創(chuàng)造就業(yè)崗位約300萬個。
而在貴州,該省此前通過第一屆大數(shù)據商業(yè)模式大賽,成功吸引一批創(chuàng)業(yè)者和創(chuàng)業(yè)項目入黔。這個比賽最與眾不同之處就在于主辦方承諾,在初賽階段向參賽者開放部分政府數(shù)據目錄;復賽和決賽階段則進一步開放經過“脫敏”處理的數(shù)據資源,幫助項目設計者開發(fā)、完善參賽方案。
誰來制定標準?
雖然開放政府數(shù)據可能帶來諸多益處,但這并不是一件“說開放就能開放”的易事,因為,政府首先要制定數(shù)據開放的規(guī)范和標準。
據了解,目前,多數(shù)地方停留于“消除數(shù)據孤島”的階段,在真正公開政府數(shù)據之前還要完成數(shù)據公開目錄設計以及數(shù)據清洗、脫敏等工作。而如何設計數(shù)據公開目錄;哪些數(shù)據先公開,哪些后公開,設定這些規(guī)則是一個難題。
比如,貴州是全國第一個嘗試公開海量政府數(shù)據的省份。此前,貴州省經信委信息產業(yè)發(fā)展處處長魏巍在接受采訪時表示,該省省一級政府機構的業(yè)務系統(tǒng)自去年6月始分批遷入“云上貴州”系統(tǒng)平臺。遷云前,各個遷云單位首先要按照涉密、非密敏感、開放三個類目梳理已有數(shù)據。遷云后,涉密數(shù)據不開放,開放數(shù)據必須開放,非密敏感數(shù)據視情況而定。
當時一位參與遷云工作的某單位人士覺得工作難度很大,因為,“省大數(shù)據辦要求我們開放數(shù)據,但開放到何種程度由業(yè)務部門自己把握。可我們一開始沒有經驗,不知道某些數(shù)據能否開放,也無法預估開放之后會否引發(fā)問題”。
不過,在一些業(yè)內人士看來,貴州先行先試后,其他地區(qū)可以借鑒經驗。“政府數(shù)據主要有政府審批、非政府審批以及服務事項三個來源,其中,行政審批數(shù)據目錄在各個地方的可復制度很高,而其余兩項數(shù)據目錄,各地也有50%-60%的重合度。”王亞川說。
“如果只是整理數(shù)據目錄,這并不困難,關鍵是如何在開放過程中保證數(shù)據安全與公民隱私。比如地理信息數(shù)據,原則上是可以開放的。但如果這些數(shù)據精確到某種程度,那可能會危害國家安全。所以,我們要把國家在安全和保密方面的規(guī)定整合進來,對數(shù)據開放行為進行制度層面的約束。從這個角度來說,那些設立大數(shù)據管理局的地方就可以通過這個職能部門完成這些工作。”鄒明達說。
不過,任偉魏卻并不看好由大數(shù)據管理局承擔組織制定大數(shù)據收集、管理、開放、應用等標準規(guī)范方面的職能。
“各地大數(shù)據管理局制定標準后,除了用于政府數(shù)據,也會使本地企業(yè)向這些標準靠攏,但問題在于,與大數(shù)據行業(yè)本身高速運轉的現(xiàn)狀相比,政府的工作節(jié)奏慢,存在滯后性,恐怕無法在短期里解決行業(yè)需要改善的問題。”
“而且,各行各業(yè)的大數(shù)據應用水平差距明顯,金融、零售、電信等大數(shù)據應用成熟的行業(yè)早已過了制定標準規(guī)范的階段,現(xiàn)在更多關注運營,以及客戶資源挖掘中的風險。而例如旅游這些當前大數(shù)據應用相對緩慢的行業(yè),反而需要盡快完成標準制定的工作。”任偉魏說。
在他看來,如果各個大數(shù)據管理局都自立標準,那么,各地的標準之間還存在能否統(tǒng)一、兼容等問題,否則,這就是畫地為牢。“而且,各地的大數(shù)據管理局還可能爭搶全國性標準規(guī)范制定中的主導權,從而出現(xiàn)掣肘。”
數(shù)據交易雛形
事實上,完成制定大數(shù)據收集、管理、開放、應用的標準規(guī)范后,大數(shù)據管理局或將進入更深層的領域—數(shù)據交易。至少,沈陽大數(shù)據管理局的職責中就包括制定大數(shù)據交易的標準規(guī)范。
據了解,目前,貴陽、武漢、陜西西咸新區(qū)等地都成立了大數(shù)據交易所,探索大數(shù)據交易機制,而廣州、哈爾濱等城市正有這方面的計劃。今年5月,國務院副總理馬凱還曾到貴陽大數(shù)據交易所考察。
但國內的大數(shù)據交易如今尚在初期。王亞川告訴記者:“我們認為,底層數(shù)據是不可交易的,但通過清洗、脫敏、建模及可視化技術形成的分析結果可以交易,而且,可以反復交易。例如,車管所的一些數(shù)據既可以服務保險公司,也可以被其他行業(yè)所用。”
而參與發(fā)起長江大數(shù)據交易所的亞信數(shù)據副總裁鄒明達認為,數(shù)據交易要經歷三個發(fā)展階段,首先是數(shù)據的信息化,也可以理解為采集數(shù)據;其次是數(shù)據的資產化,即,把數(shù)據變成類似商品實物的資產;最后才是數(shù)據的資本化。到了這個階段,數(shù)據可以被定價,可以像金融商品一樣交易。“目前的數(shù)據交易處于數(shù)據信息化和數(shù)據資產化的階段,尚未達到數(shù)據資本化的高度。”
鄒明達表示,他們做的大數(shù)據交易只是數(shù)據使用權的交易,或是通過數(shù)據加工得到的有價值的結果的交易,而非真正意義的產權交易。
而在定價方面,運營中的大數(shù)據交易所普遍采用撮合定價的方式:交易所擁有價格的建議權,數(shù)據賣方擁有決定權,而影響價格的主要因素包括數(shù)據的量級、樣本的覆蓋度、數(shù)據顆粒的大小、質量、更新頻率等。
據介紹,從今年4月中旬運營至今,貴陽大數(shù)據交易所總共完成了2000多萬的交易額,目前的交易主體主要是行業(yè)內的大型企業(yè)。比如,首批數(shù)據的交易賣方為騰訊和廣東省數(shù)字廣東研究院,買方為京東云平臺及中金數(shù)據。通常,在交易中,貴陽大數(shù)據交易所獲得交易金額的四成,數(shù)據賣家獲得六成。
而據王亞川透露,預計今年年底,貴州省將有第一批政府數(shù)據推送到貴陽大數(shù)據交易所進行變現(xiàn)。
王亞川認為,政府數(shù)據分為三類,一類是惠民信息,無償公開;一類是國家保密條例限制的數(shù)據,不予公開;還有一類則是政府可以公開但沒有義務公開的數(shù)據。“過去,政府沒有動力開放這部分數(shù)據,但在國務院發(fā)布《綱要》后,政府的開放動力增強,他們會借助大數(shù)據交易所的平臺來開放數(shù)據,同時實現(xiàn)變現(xiàn)。”王亞川說。
業(yè)內也有一種觀點認為,政府數(shù)據的實際擁有者是民眾,政府能否通過售賣這些數(shù)據獲得收益還有待探討。
對此,鄒明達則認為,政府在開放數(shù)據之前需要進行數(shù)據收集、清洗、脫敏,甚至還要按照需求加工,這些都要花費成本,所以,數(shù)據開放不能完全依靠財政支出,可以有一些收入。
事實上,除了各地帶有政府或國資背景的大數(shù)據交易所正在積極探索數(shù)據交易之路,阿里巴巴旗下的阿里云也在嘗試設計數(shù)據交換機制。
“在交易機制這塊,包括政府、阿里這樣的互聯(lián)網企業(yè),以及IBM、Oracle等ICT企業(yè),各方都想成為主導者。”任偉魏認為,在數(shù)據交易這件事上,大企業(yè)的想法是成為業(yè)內標準的制定者,而中小企業(yè)自己產生的數(shù)據不多,寄望相應的機制能夠保證其充分利用各類數(shù)據源。
不過,大數(shù)據交易距離標準規(guī)范最終落定還有很長一段路,畢竟目前,各地的大數(shù)據管理局才剛剛成立,他們的工作正從頂層設計向多個維度逐漸展開。