Data Mining的導入
Data Mining導入的四個階段:
目標(target)設定
研析現有的business process以確認Data Mining可以應用的領域,這些領域可能包括行銷、銷售、顧客服務等。在此階段,從事使用者訪談、蒐集資料等工作;其次,將資料按可能使用的模型如以clearing, filtering & transformation。此階段應產生下列各項:
- 有關data mining先導計畫實施目的之說明
- 評估計畫之評估準則
- 資料整理結果及初步分析報告
- 計畫時程
- 最後目標之大綱
Prototyping
從第一階段所獲致結果,使用合適的軟硬體從事系統prototype 模型之開發。在開發prototype的過程中,修正資料之整理方法的模型之建立。本階段應完成下列各項:
- Prototype模型開發系統
- Data Mining技術及工具之評估
- 調整business process及Data Mining系統整合之計畫
系統建置
在此階段應產生下列各項:
- 資料擷取及整理之程序及軟體
- Data Mining模型開發系統
- Data Mining上線之第一個版本
- solution的執行及migration plan
- Data Mining環境設定及開發計畫
系統移植(migration)與營運
data mining文化的建立及使用者的訓練,此階段應產生下列項目:
- Data Mining之上線環境
- Data Mining使用者清單
- Business Process對Data Mining之回應
- 系統改善計畫
Data Mining的建置
Data Mining建置的注意事項如下:
資料來源
資料來源
一般的交易資料可能不足以用來估計銀行活期存款帳戶之流失率,必須再蒐集資料,以瞭解客戶流失之原因。
資料需求的界定
找出針對與特定問題相關原因與象徵之資訊。
訪談人員需求
訪談之被訪人可能包括服務中心人員,分行經理、及行銷分析人員等。從事訪談的人員則以從事流失模型建立之分析為宜。
模型建立
模型的種類可以涵蓋簡單的OLAP,以致複雜的neural network。
資料整理
不同的模型有不同的資料需求,資料整理方式也不同。例如在neural network模型的情況,可能要將原始資料轉換成以0至1為範圍之數列。
軟體需求
利用的原有的交易資料及額外蒐集的資料後必須利用專業的軟體建立模型。所需要的軟體可能包括SQL queries及特殊的分析軟體。
資料倉儲的支援
在Data mining的應用上必須以資料倉儲作為支援。因此,在建置資枓倉儲時必須考慮到Data mining的應用,例如具有關聯性及下拉式的OLAP核心對Data mining有相當大的助益。