字號: 小 中 大 |
推薦給好友
上一篇 |
下一篇
數據的兩種組織形式:操作數據和分析數據
發布: 2008-5-05 12:59 |
作者: 王翔 |
來源:
本站原創 |
查看: 44次 | 進入軟件測試論壇討論
2.集成的
!S)UD$Z*["k:OA?B.W*AFu(V*X 全面而正確的數據是有效地進行分析和決策的首要前提。在某一個主題的統帥下,需要將數據進行提取、凈化、轉換和裝載等集成操作。
軟件測試技術門戶[f(g/IsxWg軟件測試技術門戶!_1z N*k sp*T 比如在客戶主題中,對于客戶名稱,業務數據庫的設計中有的字段名為user_name,類型為char (10),有的字段名是name,類型是varchar(12),但在進入分析數據庫時必須使用同一字段的命名和格式。這在SQL Server 2005中實際上是通過SSIS來完成的,但在數據庫設計階段也需要把數據的集成方案設計出來,而具體的操作則主要體現在對SSIS的操作上。
3Z2@T1^"BdeLL(?9O_Lx3.穩定的
"Qd5P$_yOb+{n+XR%hXH 業務系統一般只需要當前數據,在數據庫中一般也存儲短期數據,因此在數據庫系統中數據是不穩定的,它記錄的是系統中每一個變化的瞬態。但對于決策分析而言,歷史數據是相當重要的,許多分析方法必須以大量的歷史數據為依托。沒有歷史數據的詳細分析是難以把握企業的發展趨勢的,因此,數據倉庫對數據在空間和時間的廣度上都有了更高的要求。在數據倉庫中,數據一旦被寫入就不再變化了。數據倉庫可以看成是一個虛擬的只讀數據庫系統。在數據集成性中已經說明了數據倉庫在數據存儲方面是分批進行的,定期執行提取過程為數據倉庫增加記錄,但是這些記錄一旦加入,就不再從系統中刪除。正是由于數據倉庫的這個顯著特點,使得數據倉庫不需要在并發讀寫控制上投入過多的精力,因為所有的用戶只是以只讀的方式訪問數據倉庫。
軟件測試技術門戶`U U(Ro%](`8~z]*rO0_.c(s#i 圖3-3演示了數據穩定性的一個簡單的例子。在1月2日,99號客戶的消費金額為200元,當時間推移到3月 2日,99號客戶的消費金額變成250元,這一信息在業務系統中被更新了。但是在數據倉庫中(我們假定數據倉庫每天進行一次數據提。,3月2日的數據提取結果是在數據倉庫中增加了記錄222,原先的記錄111并沒有發生任何的改變,說明99號客戶在3月2日的消費金額為250元?梢,數據倉庫實際上是為99號客戶的消費行為進行了定期的拍照,并將快照存儲起來供后續的分析工作使用。
8Nx
R(P%R"jU'x
WZK8wD#t4.隨時間變化的
軟件測試技術門戶f p%B#\L
X&pNd x8PS;I 由于在數據倉庫中數據只增不減,這使得數據倉庫中的數據總是擁有時間維度。數據倉庫實際上就是記錄系統的各個瞬態,并通過將各個瞬態連接起來形成動畫,從而在數據分析的時候再現系統運動的全過程。數據提取的周期實際上決定了動畫間隔的時間,數據提取的周期短,則動畫的速度快,圖3-4示意了這種特點。
'M2B}
老湿亚洲永久精品ww47香蕉图片_日韩欧美中文字幕北美法律_国产AV永久无码天堂影院_久久婷婷综合色丁香五月