大數據 大解析

文/何宗武 世新大學財務金融學系特聘教授

這兩三年不時和一些大數據新創公司諮詢,有不少經驗,特於此分享交流。如果講大數據只是一個串流數據的科技設備,那麼大數據只是讓企業糾纏於數據庫的規模與形式上的統計計算。一言以蔽之,決策單位應該往的解析型企業(Analytical Enterprise)發展解析型企業做的各類決策,都跟以證據為基礎的數據解析有關;例如,行銷決策就稱為Analytical Marketing,風險管理就是Analytics-based Risk Management

數據解析就是以證據為基礎的認知決策行為,為什麼這件事重要?想像一下,如果你胸痛去看心臟科,醫生不實際檢查你的心臟,望聞問切就直接裝三根支架;想像一下,你的醫生直覺判斷某個藥物有用,不實際做生理檢驗,就直接開給你服用;想像一下,你會用大學成績單決定結婚對象嗎?這樣的決策很恐怖的。我們應該蒐集資料,研究資訊進步,有更好的分析技術就應該學習,這就是改善決策的方法。

解析型企業最早由Davenport[1]提出類似的概念,後來Lewis and Lee[2](2015)再以認知學習型企業(Cognitive Enterprise)擴充這個想法。數據解析能否對企業創造價值,關鍵就在於一個數據學習型的生態系有沒有緊緊和決策鏈接。我們可以和過去的「Metrics量化」一詞比較來理解何謂「Analytics」:Metrics是以量化指標(例如,各種績效指標Performance index)為基礎的系統,最具代表的就是把績效做成視覺化的雷達圖和儀表版Analytics則是以型態與關係(Pattern and Correlation)為基礎,例如,關聯性型態。

以學生學習為例,教育上的Metrics量化的績效指標會用考試成績和出缺勤等數字,透過模型計算出好學生或壞學生的標準。Analytics則透過感測器(sensor)的數位記錄來瞭解學生學習模式,例如,教室參與和使用e-learning學習紀錄,利用投入狀況(engagement inputs)去測量一個學生努力學習過程(process)的曲線,而不是學習結果(outcomes)的曲線。若只是使用結果數據,可能會把一個正在努力向上的學生退學了。實際案例可以看Cathy O’Neil[3]在其書上所抨擊的美國中學教師評鑑系統,將認真優秀教師解聘的案例。

所以,問題不在大即是美,數據再大,但是方法論不改變,產出的結果並不會有什麼改善。資料科學協助企業的層面不只是用更多數據做量化,用大量數據從事Metric計算,而不是提升Anlaytics,就會造成O’Neil所謂的大災難。然而,我們也可以廣義的說:Analytics是擴增維度的新量化(Augmented New Metrics)

我們將使用「解析型企業」一詞來說明與數據解析緊密結合的企業決策模式,是一個結合「機器智能」和「大腦智能」的解析型(Analytical)決策生態鏈

29179033_10156025310242906_733947741234790400_n

解析型決策生態鏈

沒預測,沒決策。數據解析產生預測(Prediction),基於預測衍生出可行的策略(Strategies)集合,然後做出決策(Decision),決策經過市場(Market)檢驗而有績效,進而再回饋給資料分析。在這個物聯網導向的數據經濟時代,數據的紀錄蒐集和儲存都更容易,例如:企業的行銷決策,要分析顧客行為和意見;個人購買特定商品時,要閱讀相關口碑數據;政黨提名候選人,也要做民調。過去是數字,現在是數位型態。

然而,雖然數據使用普及性增加,卻被幾種事物包裝出層層的進入障礙:第一就是被大數據包裝,將重點變成資料庫技術,數年下來,大數據三個字被炒作成比大小的工作,浮濫而且空洞;其次是被程式語言包裝,導致學習的重心變成寫程式的技術,甚至將問題炒作成哪個程式語言比較好,糾結於在Python/ R或Spark/Hadoop上面學習演算法。數據科技帶來了演算法這些事務,如果只是把資料變大,認知學習能力的維度卻沒有變大,接下來會如何?

事實上,整個數據事件與資料庫的大小無關,和決策事實有關。如果數據事件與企業決策制定無關,那就不是大數據解析;因為,如果和決策有關,數據會慢慢變大,意義也會越來越厚。所以,關鍵在於一個和決策深度連結的數據分析與預測,資料庫不但會自己長大,更會面臨來自決策成功和失敗的結果,回頭修正預測,這就是所謂的認知學習(Cognitive Learning)現階段我們看到很多號稱機器學習(Machine Learning)架構,只有機器沒有學習。

因此,我們的看法很簡單。大數據沒錯,但不是為了大而數據,不是一開始直接找一個巨量資料來操練,是一個與資料科學緊密結合的企業決策模式,就是商業數據解析(Business Analytics),且此模式運作內生一個學習過程會自然地讓一切變大變聰明,其內涵就是所謂的商業智能(Business Intelligence)。現階段全球的智慧城市(Smart City)就是最好的例子,從城市講到企業,一言以蔽之,就是「解析型企業」(Analytical Enterprise),有兩個方向:

  • 與資料科學緊密結合的企業決策模式,我們稱為Business Analytics(BA,商業分析)
  • 決策模式衍生的動態學習過程,我們稱為Business Intelligence (BI, 商業智能)
29177556_10156025310517906_8481843794306662400_n

在商業分析與商業智能成長的解析型企業

解析型企業是一個學習型的商業模式,學習過程與結果的資料都被數位化,因此,關鍵在於一個學習過程是否開放進步,而數字解讀也不是各抒己見,除了資料,須要有深厚的資料素養(Data Literacy)。舉例:如果我們要判斷一個人是不是有邏輯能力,是否可以因為他念日文系,就認為他邏輯不好?我們是否可以因為一個人有資訊工程碩士,就認定他是大數據分析專家?我們是否可以看到一位在公車上不讓座的高中生,就認為他是沒教養的小屁孩?

資料素養不是在統計學或資料探勘的技術上打轉,重點在於對決策問題要有深度認識,就像醫生越深度認識病人,越能對症下藥。套一句哲學家康德的老話:沒有知識的資料是盲目的,沒有資料的知識是空洞的。

[1]Davenport, Thomas H.,‎ J.Harris,‎ and D. Abney (2017) Competing on Analytics: The New Science of Winning. Harvard Business Review Press. 2017是最新修訂版,原書2007初版,中譯「魔鬼都在數據裡」。

[2]Lewis B. and Lee Scott (2015) The Cognitive Enterprise. MK Press, USA.

[3]Cathy O’Neil(2017)Weapons of Math Destruction—How Big Data Increases Inequality and Threatens Democracy. Penguin Random House, USA.

29177823_10156025307522906_6087009990432784384_o

隨時補充新觀點,《立報傳媒》Line→http://bit.ly/2YyjUW1