很多數據庫管理系統提供商比如Microsoft、Sysbase、Oracle都有其構建數據倉庫專門的工具。這些工具由于是為構建數據倉庫而設計,因此結構非常的復雜、對數據庫設計人員的要求比較高,在軟件開發中可實施性比較低。實際上關系型數據庫從提出到現在已有30多年的歷史,關系型數據庫是現在所有數據庫中包括面向對象數據庫、關系型面向對象數據庫發展最為完善的一種。關系型數據庫中的存儲過程、觸發器、發布和訂閱模式有足夠的能力解決上面的問題。因此利用現有的關系型數據庫中這些成熟穩定的工具,就可以構建輕量級的數據倉庫。 輕量級數據倉庫的構建模型如下圖2所示,主要包括如下幾個步驟:數據的清洗,根據需求定制主題集合,定制事實表采集規則,編程接口之實現。
數據清洗是原始數據進入數據倉庫的第一步。軟件的數據采集器采集到數據庫中的數據可能含有不規則、錯誤的數據,也就是噪聲數據,這些數據數量少,但是可能極大地影響結果的正確性,因此必須清洗掉。數據清洗主要是由數據庫中的規則以及根據業務定義的清洗規則來實現的。數據庫中的規則保證了數據庫中的數據是合乎數據類型的而業務的清洗規則保證了數據庫中的數據是合乎邏輯的。
輕量級數據倉庫的第二步就是根據需求定義主題。主題是數據庫中以某個表為基表,以其列集為擴展維度而構成的一系列事實表的集合。事實表的構建規則應該盡可能的和需求相吻合,這樣可以最大程度上減輕software report 從Center DB 提取數據造成的對數據庫的壓力。主題和事實表都是可以擴展的,也是可以重復利用的。事實表可以也作為基表進行擴展新的事實表。

延伸閱讀
文章來源于領測軟件測試網 http://www.kjueaiud.com/