親愛的,我把資料變大了! …….. 然後呢?

文/何宗武世新大學財務金融學系教授

先說結論:科技帶來了大數據和演算法這些玩意,如果只把資料變大,而不是學習能力,接下來會如何?從小數據都學習不到的價值,大數據只是讓它更遙不可及。

4/20的一則新聞,報導科技創新的烏龍,標題是【連榨汁機都騙人!這家融資1.2 億美元的公司成為矽谷大笑話】。去年(2016)暑假在上海客座的時候,每周三晚上我一定會看【創客中國】這個節目(樂視視頻可以看),這個節目提供一個平台給資金提供的創投業者和有資金需求的創業者,一集有三個提案,每個創投提案都相當的有趣,去年就看到一個雷同榨汁機的案子,類似膠囊咖啡機的中藥膠囊機,同時我也會隨手上網查一查真實程度。畢竟,科技創新衍生的市場活動是一個值得省思的問題。每一個時代都有所謂的科技趨勢,二十年前就是奈米和雲端運算,當代就是虛擬實境、人工智慧和大數據等等。科技引發各式各樣的創新點子,科技創新引發的經濟活動就是創投(Venture Capital)。為了要吸引資金,創新者必須盡可能誇大。這是科技產業加上創投合演的綜藝節目,投入眼簾的,則泡沫多於真實。

最近教育部頒佈了中學未來的課綱,中學生將開始學習寫程式的教育。然而,教育政策是一種人力資本的投資,和市場投資的本質是一樣的,長期投資要尋找趨勢,短期投機要從波動風險中找套利機會。教育方面需要的是長期深根,也就是必須掌握一個發展的趨勢,而不是找泡沫。大數據的問題不是資料庫,而是資料分析的人才;金融科技的問題不是科技,而是創新的腦袋。周星馳的電影功夫,有一句台詞:腰裡拽個死耗子,冒充打獵的。買書從來不是問題,有個大書架就可以,從閱讀發現道理才是問題。教育單位除了要設計少量的新課程,關鍵的問題在於原來的課程要怎麼改變?舉例,統計學除了原本的統計估計和檢定之外,對於大規模資料描述的敘事能力必須超過技術能力。

過去,計量經濟學的故事是由簡化的理論所預設,因此,實證後的解釋,大多集中統計配適程度(R square)和檢定的顯著性(apha=5%)。因為資料的樣(Variety)和量(Volume)變多了之後,意義就會超過原先理論框架所預設,新資料本身就蘊含了大量的內容。因此,視覺化就變成是一個探索意義很重要的工具。所以,視覺化不是一個看圖說故事的錦上添花之事,而是雪中送炭:透過圖形簡化複雜問題的結構。

以視覺化為例的進一步問題,和寫作一樣,視覺化需要的是風格,不單是電腦技術。一個視覺化表示的方式,和作家,攝影師與畫家表現意義的原理完全一樣。大數據視覺化的訓練,要訓練的是類似畫家的素養,不是軟體操作或程式語言。畫家要畫圖之時,需要先構圖,也需要對一個被畫的對象有深度的觀察與理解。哈利波特的創作,作者多元文化素養是關鍵。iPhone能讓你隨手拍照,卻不能成就一名攝影大師。

風格是什麼?簡單地說,紐約時報,經濟學人等媒體,都有一套數據和圖表處理的風格。一門視覺化的課程,要教育的就是風格的養成。一們大數據分析的課程,要學習的就是掌握資料脈絡的風格。頂尖的經濟學家,蘋果橘子經濟學的作者Steven D. Levitt,就是一個很有風格的經濟學者,只要看到文章就知道是他寫的。被譽為行為財務(或行為經濟學)之父,快思慢想一書的作者Daniel Kahneman更是如此,Kahneman從任教的Princeton大學退休之後,和夥伴共同成立顧問公司,一個心理學家的工作竟然是協助企業解讀數據,並制定正確的決策。當然,Kahneman是因為掌握了人類行為的模式的特性,而能夠解讀數據的意義。資料不就是紀錄了行為的數據足跡嗎?依照Kahneman的看法,演算法就是紀律式的學習與執行,認知(Cognitive)是一種演算法(Algorithms);如果教育能賦予思考主體很好的演算法,小數據就完勝大數據。一個好的演算法,不需要數理上的複雜,而是能從眾多錯誤之中產生紀律式的學習行為。

科技帶來了大數據和演算法這些事務,如果我們只把資料變大,而不是認知與學習能力,接下來會如何?也就是說,從小數據都學習不到的價值,大數據只是更讓它遙不可及。套一句俗諺:歷史一再重複,因為首次發生之時,人們多不重視。從建中生假受訪事件,如果我們的環境,習於犯錯,樂不務實,對偏差視而不見,追逐尖端科技或寫程式入課綱這些事,到頭來不是君子不器,而是君子難器。

18118663_10155090276792906_8364583458754155387_n


(本文圖片來源:cc)

隨時補充新觀點,《立報傳媒》Line→http://bit.ly/2YyjUW1