Trinity Metaman

元數據(Metadata)是指用來描述資料/定義/系統的說明資訊。透過元數據的管理,可讓相關人員了解其所接觸資料的意義、來源及流向,並在進行變更時,能夠找出資料位置及其上下游相依作業,避免產生資訊不一致的問題或造成日常作業出錯。其終極目標是支援企業達到資訊治理(Information Governance)

元數據基本分類有三:

  • 技術元數據(Technical Metadata):技術元數據用來管理實體資料庫中的欄位型態定義資訊。支援主流資料庫元數據之擷取與差異比對,並可進行數據剖析(Data Profile)及數據質量(Data Quality)工作。可建立欄位關聯,產出血緣關係表。
  • 業務元數據(Business Metadata):業務元數據用來定義各行業特定的業務名詞、業務規則、業務情境以及代碼表等資訊。業務元數據可使企業全體獲得一致的業務理解,促進有效的交流與溝通。
  • 應用元數據(Application Metadata):應用元數據用來定義各項系統/程式/報表的定義資訊。配合業務元數據,可完善企業知識管理(Knowledge Management)。

此外,亦整合 ETL 元數據管理於此模組當中,支援 ETL 作業設計。

業務與應用元數據

建立業務元數據與應用元數據時,會經過編輯、提交、審核及發布的流程,確保相關人員對發佈的資訊具有共識,才可發布至查詢平台提供企業中各部門人員查詢。技術元數據無須審核,但仍須經過具備相關權限的人員進行發布。

查詢平台簡單易用,透過瀏覽器即可操作使用。查詢一個項目時,系統會自動分析及比較元數據資訊,自動將該項目的詳細資料內容當中出現的相關名詞加上連結,點擊連結即可交互參照名詞之間的關係。

技術元數據

立基於技術元數據,可進行數據剖析(Data Profile)及數據質量(Data Quality):

  • 數據剖析(Data Profile):針對來源數據或現存數據(包含存在於資料庫或分析系統當中的資料),經過數據剖析的過程,得到數據內容、值域分布及數據標籤。有了數據內容及值域分布,即可進一步制定數據質量的檢核規則,以供數據質量稽核時使用。依據分析而得之標籤評分,可進行智慧自動貼標,進一步得知新進欄位與數據域的關係,快速識別特定的欄位或機敏資料相關欄位。另提供Top 10/Bottom 10 值域分析及圖形化剖析結果圖表。
     
  • 數據質量(Data Quality)工作:數據質量分析會依賴數據剖析後的貼標結果,來對數據域的定義制定分析規則。此外也支援自定義質量檢核規則,能以Groovy腳本自定義質量檢核規則,方便依現實環境快速建置。規則訂定完成後即可進行數據質量評分,提供相關人員進一步評估企業資料的情況。