商業智慧 (Business Intelligence) 簡介-3 資料分析階段

資料分析階段

此階段主要是執行資料超市資料之累積與後續之分析作業。

資料超市乃為支援某些特定的分析應用而建置的資料庫。在已存有資料倉儲的情形下,因應加速各項分析作業且易於維護其資料,資料超市通常是資料倉儲的子集合。實務上可以省略資料超市而由資料倉儲直接支持分析作業,也有小規模BI專案捨資料倉儲而直接建構資料超市者。

至於資料的分析,業界發展出二種技術:線上即時分析 (OLAP,On-Line Analytical Processing) 與資料探勘 (Data Mining),以下說明之:

1. OLAP
線上即時分析係採用多維度之資料結構 (Cube) 將資料載入,以進行多項不同維度整合的分析。OLAP的應用多為報表:相較於未導入BI時,IT部門須先以批次方式將所需資料自各來源資料庫匯出,再以人工或程式加以計算後得出結果-->靜態報表;若想要依不同角度分析,又再需人工作業或新增運算程式以產出另一份報表。這導致IT無法支援企業快速變動之需求。經由OLAP,主管或決策者可以線上 (不必假IT之手) 得出動態 (多角度分析) 的結果,加速了決策流程。近年的趨勢是為加速OLAP產出,有業者推出「Cubeless」OLAP產品,號稱不建Cube,其實是將之載入至記憶體中執行,所以可達到「Real-time」產出結果的效能。
 
2. Data Mining
資料探勘是利用統計、人工智慧 (AI) 或其他的分析技術,在巨量歷史資料內深度尋找與發掘未知、隱藏性的關係與規則,從而達成分類(classification)、推估(estimation)、預測(prediction)、關聯分組(affinity grouping)、同質分組(clustering) 等結果。 參閱 "資料探勘 (Data Mining) 簡介"。
 
嚴格說來,OLAP充其量只是將資料已知的「複雜、模糊」關聯性清晰呈現,屬於統合性報表層次,尚未達到提供「智慧」的程度。資料探勘則挖掘出資料未知的關聯性以便於我們建立與調整模型,進而求得預期的結果;這超越了主事者Domain Knowhow的經驗與直覺,才是真正提供了「智慧」分析。以實際的應用說明:跨國大企業建立一套戰情系統,以供高階決策者依據各直營/經銷據點之產品最新銷售與庫存量、各區域倉儲之存貨現況、各工廠之產能等資訊,決定下週之產品調派、次月各區業績重點與下一季的商品生產備貨等,這是OLAP的應用。銀行信用卡部門針對卡友之刷卡/付費、貸款/還款等紀錄進行違約機率評估,進而調整授信等級以降低風險,這是Data Mining的應用。前者以多維度分析產出各式最新 (甚至是即時) 產銷綜合資訊,以供企業決策參考;後者則以卡友之相關資料經分析後建立風險模型,再套用前述之資料以預測個別卡友未來之違約機率。OLAP應用大致上已普及於中大型企業,而Data Mining則因其應用層面與效益較不「直覺」,相對普及率較低,尚待推廣。下面舉最典型的零售業案例以彰顯Data Mining的價值。
 
1990年代,美國Walmart超市於資料庫中分析出啤酒與嬰兒尿布於週末傍晚的強烈關聯性,進而找出原因是年輕父親常被妻子交待週末下班買尿布回家而順便帶啤酒,因此調整商品陳列方式—將較高價尿布陳列於啤酒旁邊, 結果提昇了銷售量。最新的經典案例是美國Target 百貨,其資料專家在分析大量資料後,建立了經由約25 種商品銷售數據為因子的「懷孕預測」模型;經套用後若發現顧客之購買行為符合模型時,就會開始啟動行銷活動,在不同的懷孕階段採取相對應的促銷方案。
 

Back to > BI系統架構

Back to >資料匯整階段

Go to > 資料呈現階段與BI應用