在德國(guó)隊(duì)7:1大勝巴西之前,德國(guó)足球俱樂(lè)部在日常訓(xùn)練中引入大數(shù)據(jù)的例子是涂子沛在演講時(shí)常講的內(nèi)容。在德國(guó)隊(duì)捧得大力神杯之后,這個(gè)例子還會(huì)在涂子沛的講座中更多地出現(xiàn)。
涂子沛,是數(shù)據(jù)工作者,也是暢銷(xiāo)書(shū)《大數(shù)據(jù)》的作者。今年5月,他的新書(shū)《數(shù)據(jù)之巔》上市?!按髷?shù)據(jù)不只是科技問(wèn)題,已經(jīng)涉及社會(huì)管理等各個(gè)方面,這本新書(shū)的初衷是想把大數(shù)據(jù)這個(gè)現(xiàn)象放在歷史的縱軸上、通過(guò)國(guó)際對(duì)比,把它分析透?!蓖孔优鎸?duì)中國(guó)科技網(wǎng)說(shuō),他希望能夠通過(guò)歷史的比對(duì),找出中國(guó)的優(yōu)勢(shì)在哪里、差距在哪里,以及下一步該怎么做。
美國(guó)的數(shù)據(jù)文化是如何形成的
美國(guó)的數(shù)據(jù)文化對(duì)歷史發(fā)展?jié)撘颇挠绊懽饔檬恰稊?shù)據(jù)之巔》的一條主線。從美國(guó)建國(guó)之初,人口普查就在美國(guó)的制度建設(shè)上起到了重要作用;在南北戰(zhàn)爭(zhēng)時(shí)期,人口普查的結(jié)果也直接影響了戰(zhàn)爭(zhēng)的發(fā)展;《紙牌屋》之前,1930年代好萊塢就在用統(tǒng)計(jì)結(jié)果來(lái)決定劇本及主角人選……
“人口普查一直都是驅(qū)動(dòng)美國(guó)社會(huì)大數(shù)據(jù)發(fā)展的一條主線,世界上第一臺(tái)商業(yè)計(jì)算機(jī)也是為美國(guó)人口普查服務(wù)的。但這些歷史從來(lái)沒(méi)有很系統(tǒng)地分析和介紹到中國(guó)來(lái)?!蓖孔优嬲f(shuō)。為了完成寫(xiě)作,涂子沛把美國(guó)的人口統(tǒng)計(jì)史、農(nóng)業(yè)統(tǒng)計(jì)史、工業(yè)統(tǒng)計(jì)史全看了一遍。有人評(píng)價(jià)說(shuō),涂子沛是從用數(shù)據(jù)重寫(xiě)了美國(guó)歷史。
利用網(wǎng)絡(luò)、書(shū)籍和檔案3個(gè)渠道,涂子沛在美國(guó)找所需的材料并不困難?!肮矆D書(shū)館是免費(fèi)開(kāi)放,需要的小眾圖書(shū)在亞馬遜上也能夠買(mǎi)到,它有二手書(shū)的交易平臺(tái)?!痹谒鸭牧系倪^(guò)程中也這位大數(shù)據(jù)專家感受到了中美在數(shù)據(jù)文化方面的差距,“我們的歷史資料數(shù)字化和美國(guó)相比存在差距,而大數(shù)據(jù)需要的是電子化的數(shù)據(jù)。”
日本可以,中國(guó)為什么不可以
《數(shù)據(jù)之巔》雖是以美國(guó)為主體,但全書(shū)中最讓涂子沛感動(dòng)的卻是書(shū)中日本如何在二戰(zhàn)后快速崛起的部分——日本企業(yè)在戰(zhàn)后在美國(guó)“質(zhì)量管理之父”愛(ài)德華茲·戴明的幫助下應(yīng)用統(tǒng)計(jì)方法改善全面提升了產(chǎn)品質(zhì)量,并在短時(shí)間內(nèi)創(chuàng)造了經(jīng)濟(jì)奇跡。
豆瓣上有讀者評(píng)論說(shuō),看到這章時(shí)“眼淚嘩嘩的”,而這個(gè)部分涂子沛是也留著眼淚寫(xiě)完的。為了把這章寫(xiě)完,涂子沛查閱了幾乎所有關(guān)于戴明的傳記,他聯(lián)系了每個(gè)傳記作者,甚至電話聯(lián)系了戴明的女兒,向她查證一些歷史舊事。
“我寫(xiě)這個(gè)故事的時(shí)候,我想了很多,我想我們應(yīng)該想一想,問(wèn)一問(wèn),日本行,中國(guó)為什么不行。”涂子沛認(rèn)為,日本15年崛起,有兩個(gè)答案,一是用好數(shù)據(jù),二是他們的學(xué)習(xí)的精神,這也是最關(guān)鍵的?!耙姓J(rèn)自己不行,正心誠(chéng)意的想西方學(xué)。中國(guó)近代史的幾百年,一直拒絕西方文明,普世價(jià)值具有普世性,不能拒絕?!?/p>
書(shū)中第五章開(kāi)頭,涂子沛引用了陳獨(dú)秀的話,“吾敢斷言曰:倫理的覺(jué)悟,為吾民最后覺(jué)悟之最后覺(jué)悟?!标惖囊馑际? 中國(guó)不僅要學(xué)科技、還要學(xué)制度、最后要學(xué)倫理?!?/p>
希望影響政策決策者和企業(yè)管理者
第一本書(shū)《大數(shù)據(jù)》,涂子沛兼職寫(xiě)了8個(gè)月,而《數(shù)據(jù)之巔》,辭去工作的涂子沛用了整整8個(gè)月的時(shí)間。“大數(shù)據(jù)很新、很熱、很重要,我感覺(jué)有義務(wù)、有一種使命感要把這個(gè)話題在中國(guó)社會(huì)說(shuō)清楚。《數(shù)據(jù)之巔》在戰(zhàn)略和頂層設(shè)計(jì)的層面上為大數(shù)據(jù)的建設(shè)提供了思路、指出了我們的差距?!蓖孔优嫦M@本書(shū)能夠影響政策的決策者和企業(yè)管理者。
涂子沛為“之巔”設(shè)計(jì)了三層含義。第一層含義是政策維度,大數(shù)據(jù)是人為的現(xiàn)象,因此建設(shè)好需要頂層設(shè)計(jì)。第二個(gè)含義是技術(shù)維度,使用數(shù)據(jù)的巔峰的形式是什么?是讓機(jī)器自動(dòng)的處理數(shù)據(jù)使用數(shù)據(jù),邁向智能社會(huì)。第三層是文化維度,是站在數(shù)據(jù)的巔峰,看數(shù)據(jù)是如何興起的。
“科技符號(hào)轉(zhuǎn)化為文化符號(hào)是這本書(shū)的使命,科技符號(hào)是精英的符號(hào),是小眾的符號(hào),文化符號(hào)是大眾的符號(hào),要讓數(shù)據(jù)這個(gè)小眾的符號(hào)變成大眾的符號(hào),要讓數(shù)據(jù)的文化的意識(shí),要根植到大眾的意識(shí)中,讓大家都來(lái)使用數(shù)據(jù),用數(shù)據(jù)說(shuō)話,用數(shù)據(jù)決策、用數(shù)據(jù)管理?!蓖孔优嬲f(shuō)。
問(wèn)答精選
問(wèn):搜集數(shù)據(jù)和分析數(shù)據(jù)哪一更困難?
答:兩個(gè)都難,只是難點(diǎn)在不同的地方,搜集數(shù)據(jù)需要的是廣度、分析數(shù)據(jù)需要的是深度、精度。搜集數(shù)據(jù)更花時(shí)間。好比寫(xiě)作,要用一桶水,就要有10桶水,很多時(shí)候,海量的材料中,真正有用的只有一句話。
問(wèn):下一本書(shū)寫(xiě)什么?
答:下一本書(shū)要承接《數(shù)據(jù)之巔》的話題,大數(shù)據(jù)未來(lái)會(huì)推動(dòng)我們的社會(huì)邁向智能社會(huì),我會(huì)寫(xiě)中國(guó)和美國(guó)在邁進(jìn)智能社會(huì)中的種種挑戰(zhàn),以及如何應(yīng)對(duì),將從政策、經(jīng)濟(jì)、文化這3個(gè)維度上來(lái)分析這個(gè)問(wèn)題。
問(wèn):國(guó)內(nèi)的大數(shù)據(jù)還有哪些比較欠缺的地方?
答:使用數(shù)據(jù)的意識(shí)、分析數(shù)據(jù)的工具、開(kāi)放數(shù)據(jù)的理念,這些都是比較欠缺的。我們還沒(méi)有用數(shù)據(jù)說(shuō)話的習(xí)慣,我的第一本書(shū),說(shuō)我們是“差不多民族”,我們的民族講究含蓄,不求精確,我們的邏輯性、精確性、理性思考的水平都偏低,這都是缺乏數(shù)據(jù)文化的表現(xiàn)。數(shù)據(jù)文化首先是尊重事實(shí),其次是追求精確。數(shù)據(jù)是事實(shí)中最尖銳、最精確的事實(shí),你用文字描寫(xiě)的事實(shí),就是沒(méi)有用數(shù)據(jù)描寫(xiě)的精確,再次是推崇邏輯和理性。
問(wèn):影響中國(guó)大數(shù)據(jù)應(yīng)該的問(wèn)題有哪些,如何化解
答:企業(yè)基于數(shù)據(jù)的投資有幾個(gè)特點(diǎn),首先,這種投資有不確定性,回報(bào)的不確定性。我們經(jīng)常講啤酒和尿布的例子,但我們?cè)谕顿Y的時(shí)候不確定能獲得這樣的結(jié)論,想大海尋寶一樣,讓管理者猶豫要不要投資。第二,就是基于數(shù)據(jù)的回報(bào)是分散的,分散在企業(yè)的各個(gè)環(huán)節(jié),很難計(jì)算他的回報(bào)。分散性和不確定性導(dǎo)致了企業(yè)在投資時(shí)猶豫。此外,數(shù)據(jù)化的管理是基于精細(xì)化管理,我們?nèi)狈?shù)據(jù)文化,一個(gè)原因是我們的社會(huì)還比較粗放,還沒(méi)到精細(xì)化競(jìng)爭(zhēng)的階段,但我們?cè)谥饾u邁入這個(gè)階段,西方已經(jīng)進(jìn)入了這個(gè)階段。
問(wèn):對(duì)于大數(shù)據(jù)的發(fā)展有沒(méi)有擔(dān)憂
答:會(huì)有擔(dān)心,第一個(gè)是隱私。第二,常常越精確的東西就越脆弱,我們的數(shù)據(jù)都存儲(chǔ)在云中,一旦計(jì)算機(jī)停止運(yùn)行了,那我們的城市也會(huì)停止運(yùn)行。人犯錯(cuò)是個(gè)錯(cuò)誤,計(jì)算機(jī)犯錯(cuò)那就是個(gè)災(zāi)難。人對(duì)機(jī)器的依賴越來(lái)越嚴(yán)重、人機(jī)共生的關(guān)系越來(lái)越明顯、人對(duì)手機(jī)的使用到底是提高了效率,還是降低里效率?這些問(wèn)題,會(huì)引導(dǎo)我們?nèi)ハ蚰睦?,我們還說(shuō)不清楚,需要更多的研究。
問(wèn):對(duì)美聯(lián)社利用機(jī)器自動(dòng)寫(xiě)稿怎么看
答:這是人工智能在新聞媒體的應(yīng)用,也是我下一本書(shū)探討的問(wèn)題,因?yàn)槿斯ぶ悄艿膽?yīng)該越來(lái)越多的崗位要被機(jī)器取代。但以后還是一定需要記者的,人工智能完成的是一個(gè)最基本的工作,到時(shí)候會(huì)更需要優(yōu)秀的記者。它替代的是最平庸的,最簡(jiǎn)單的,重復(fù)性最多的工作,這意味著記者的總?cè)后w將會(huì)收縮。