6. 對大量的前端資源進行數據源分析
在數據倉庫實現過程中,你不得不在舊有的數據中艱難跋涉,這些數據來自老的數據庫、老的磁帶機以及遠程的數據。它們中的大部分都凌亂不堪,并且難以獲取。你要對這些數據進行大量處理,并且還要設計ETL程序來尋找其中的有用信息。如果你希望整個項目做起來比較順利,并且找到一種方法能夠一次成功,那就需要你的開發人員必須花費足夠的時間來充分研究這些舊有數據,將凌亂的數據規則化,并盡力設計和實現強壯的數據采集和轉換過程。數據倉庫的ETL部分會占用整個項目資源的百分之八十,所以一定要確定你的資源都用在刀刃上了。
7. 將人際關系處理放在首位
在數據倉庫實現過程中真正的地獄不是來自技術或者開發方面,而是來自你周圍的人。你也許會遇到一個對項目并不樂觀而又沒時間聽你陳述的領導。你也許會遇到一些開發人員將進度拖延太長時間還抱怨為什么不能用老方法實施。你也許還會遇到一些抱有不切實際的幻想的用戶,他們希望輕點鼠標就能實現想象中的功能,但卻不愿在他們那邊多做些智力投資,更好的培訓他們自己的員工。而你也已經疲憊不堪,鼓勵投資,以及在開發團隊和用戶(甚至老板)中推廣新的開發技巧。
總之你要保持微笑。當一切搞定,你的煩惱也就一掃而空了,笑到最后才笑得最輕松。