數據的力量

/蘇建州,《立報》總編輯,世新大學傳播管理學系教授

有此一說,除非這幾年你不住在地球,否則不可能沒聽說過「大數據」。

不管是湊熱鬧或是看門道,如果大數據、資料視覺化、機器學習等還沒成為你工作、學習或日常生活的話題,這也許是種警訊,因為你可能有嚴重的資訊、知識落差問題。

坦言之,許多誇飾的大數據應用是被過度神化,許多追逐熱潮而成立的大數據中心缺乏方向和做法,才踏出第一步就迷路了。但這是探索新知必經的過程,也是學習和成長的一部分。然而,隨著「大數據+」鋪天蓋地融入各專業領域而來,數據終將會和語言、文字一樣重要,是每個人與外界溝通學習所必備的基本能力,這一步必須先跨出去!

「我們生活在兩個平行的世界中。一個是有形、吵雜、散亂,可以看到、摸到、感知到它的世界;另一個世界以數學形式存在,而『數據』是這兩世界間的橋樑。」

The Joy of Data| BBC 紀錄片(2016)

1850年間的英國曾發生大規模霍亂,經過很長時間仍無法控制。當時數據之父威廉• 法爾(William Farr)利用系統的數據蒐集和分析,證實霍亂死亡率會隨著居住地相對泰晤士河海拔高度增高而下降,因而斷言霍亂肇因於大量廢水排入泰晤士河的惡臭並透過空氣傳染。當時,此重大發現一度被譽為「用打字機和紙所能完成的最偉大成就」。但不久之後,法爾用新的數據推翻自己之前的結論,發現水井分佈和患者分佈間的關係,最後判定霍亂是透過水傳染,源頭是一口被污染的水井,霍亂疫情也因此被控制。

從理論到驗證,從問題到答案,數據是探索真相的橋樑。即使是深根蒂固的觀點也可被挑戰和動搖,這就是數據的力量。170年前如此,當今亦然,且拜數據「爆炸」之賜,力量更為強大。

  • 士兵心態(Soldier mindset): 動機性推理(Motivated reasoning),攻擊他人觀點或防禦自己觀點,目的是讓自己觀點贏或他人觀點輸。
  • 偵查員心態(Scout mindset): 蒐集和處理訊息,目的不是要保護自己想法,而是尋求真相,因此樂見自己立場被推翻。

Why You Think You’re Right, Even If You Are Wrong| Julia Galef (2016)

同樣是資料導向決策(data-driven decision making,DDDM),當你改變看待數據的情緒,力量也跟著改變!法爾起初是從士兵心態出發,想做的只是透過演繹來證實猜測(當時認定所有疾病都是惡臭空氣造成的)。調整心態後的法爾,從數據本身出發,透過歸納總結規律,即使結果推翻了自己過去的偉大發現,不是尷尬和羞恥,而是驕傲和喜悅。

拉丁文datum一字首見於1646年,原意是「被給予的東西(a thing given)」。三百多年後,科技發展使得萬物、萬事皆可測,逐漸被給予數據化(Datafication),成就了蓬勃發展的「大數據+」。

雖然更多的數據意味有更多機會探索事實的真相,但同時也給予更多被操弄的機會。

「數字不會說謊,但說謊者會操弄數字。(Figures don’t lie but liars figure) 

馬克• 吐溫(Mark Twain )

當務之急是體認「數據素養」的重要性,提升「數據識讀」能力,不僅有助判斷數據是否被操弄,也可運用數據的力量來改善生活、工作與思考方式。

如果你覺得數據有趣,就盡情地享受用數據認識世界之樂;如果覺得數據無聊,那是因為還沒有意識到數據與真實世界的聯繫,不妨從生活周遭一些感興趣的小事、小物開始,試著理解小數據的力量,先跨出「數據素養」與「數據識讀」的第一步!

18118842_10155084128977906_5642753342823381776_n



查看更多文章:

(本文圖片來源:cc)

隨時補充新觀點,《立報傳媒》Line→http://bit.ly/2YyjUW1