3. 不要設計任何無法擴展的東西
在聯機處理過程(OLTP)應用中,數據分析并不是一個真正的應用程序。實際上,數據分析的關鍵是獲取大量舊的數據,從中提取數據模型,并以此模型推斷出新的信息。而你所編寫的訪問潛在信息的代碼應該具有可擴展性,可以附加新的數據。千萬別在支持數據分析的代碼中假定數據都是固定格式的。
4. 不要附加不必要的功能
一個倉庫要做的是恰到好處的服務,用戶走進倉庫,從貨架上取得自己所需得信息,僅此而已。由于業務智能、分析以及規律性的問題都有各自的處理程序,因此你的客戶唯一的需要就是獲取信息。他們需要一種應用環境,可以讓他們快速的從數據倉庫中取得分析過程所需的數據,而不論這個數據是什么樣子的。也許你想幫助他們精煉一下獲得的數據,但最好不要這么做。一定要記住,不要給客戶的數據分析程序添加任何會影響數據訪問性能的功能。
5. 不要簡化數據清除和數據源分析的步驟
在實現數據倉庫過程中最應該注意的地方就是為Extract-Transform-Load機制分析數據源,以及為優化負載而清除數據。安全的做法是假設項目經理在這個階段會需要整個項目資源的一半以上。相反,如果你在這方面進行了簡化,稍后肯定會后悔。所以就算系統工作緩慢,也不要簡化清理舊的數據的過程。
文章來源于領測軟件測試網 http://www.kjueaiud.com/