第三步就是定義事實表的采集規則。由于Software report 不是直接從DB里面提取數據而是從Center DB中提取數據,因此Center DB中的數據必須能夠實時地反映DB中數據的變化,因此需要定制一定的采集策略。事實表的采集規則這里主要是指采集的頻度策略。不同的事實表對數據的采集頻度有不同的需求,例如按天統計的事實表和按周、月、年統計的事實表采集頻度肯定不相同。事實表采集規則也是主要依靠需求制定的。 最后一步就是所有這些清洗規則,事實表采集規則之實現。既可以通過數據庫數據庫之間的接口實現,也可以通過其他編程接口實現。數據庫與數據庫之間的編程接口主要是通過存儲過程和觸發器以及數據庫之間的發布訂閱模式來實現,F在很多語言包括C,C++,JAVA都和數據庫之間有方便的接口ADO、DAO、ODBC、JDBC,通過這些接口編程人員可以更加靈活的操作數據庫,并對數據庫中的數據進行處理,也可以實現數據清洗、事實表采集規則。
5 比較
輕量級數據倉庫和企業級數據倉庫相比有如下異同: 企業級數據倉庫主要目標是為企業發展提供決策支持。輕量級數據倉庫主要目標是提高軟件的響應速度。企業級數據倉庫的數據源是海量的,可能是10年的數據也可能是20年的數據。輕量級數據倉庫的數據源要少的多,主要是軟件的數據采集器采集的數據,量級在百萬到千萬級。企業級數據倉庫的數據源是異構的,可能是源于不同的DBMS,也可能是源于不同的存儲介質包括磁帶、磁盤、光盤。輕量級數據倉庫的數據源是同構的,主要是同一種DBMS下的數據。
企業級數據倉庫和輕量級數據倉庫的思想是一致的,都是面向主題的,穩定的,一經寫入從不或者很少修改的。企業級數據倉庫和輕量級數據倉庫都是以星型為擴展模式構建的事實表的集合,本質上把頻繁運算的結果集存貯為事實表,從而達到一次運算重復利用的效果。
6 結論
文章來源于領測軟件測試網 http://www.kjueaiud.com/