字號: 小 中 大 |
推薦給好友
上一篇 |
下一篇
使用數據挖掘獲取商業智能
發布: 2008-5-05 12:55 |
作者: 王翔 |
來源:
本站原創 |
查看: 55次 | 進入軟件測試論壇討論
在決策樹顯示區域中,顏色代表“事例”的密度,在例中即代表滿足相關條件的客戶的密度。顏色越深則節點中包含的事例就越多。從圖2-51可以發現,“Yearly Income = $150K+”這一節點的密度高于其他任何節點,代表符合“Yearly Income = $150K+”這一條件的金卡客戶是最多的。
根據決策樹上的“全部”節點,“挖掘圖例”窗格會有如圖2-52所示的顯示數據,這表明總共抽樣的數據有10 281條,其中銅卡用戶最多,占了55.42%。
樹的第一個級別由“yearly income”屬性決定。樹的組織由算法決定,其基礎是該屬性在輸出中的重要性。這意味著“yearly income”屬性是最重要的因素,它將決定客戶可能選擇的會員卡的類型。選擇“Yearly Income = $150K+”節點。該特性窗格顯示收入較多的客戶中,45.98% 的客戶可能會選擇金卡。這個百分比要比“全部”節點中的(11.67%)高得多。
可以通過改變圖2-51的“顯示級別”滑塊的值或者直接在決策樹顯示區域中,單擊“+”或“-”號來改變決策樹顯示分支的層級。當用這種方法在樹中做進一步調查時,可以探索到金卡客戶的百分比是如何演化的。
打開“Yearly Income = $150K+”節點,如圖2-53所示。選擇顏色很深的“Marital Status不等于S”節點。在“挖掘圖例”窗格中,可以看到收入高于150 000美元且已婚的客戶中,較高百分比(83.54%)的客戶可能會選擇金卡。而同時“Marital Status =S”節點的顏色非常淺,這意味著這些客戶選擇金卡的可能性非常小。

另一方面,從圖2-52還可以看到“Yearly Income = $10K-$30K”節點的顏色非常淺,這意味著這些客戶選擇金卡的可能性非常小!巴诰驁D例”窗格顯示在此年收入范圍內的客戶中,92.47% 的客戶可能會選擇普通卡。樹還顯示已無法對此節點進行進一步調查,這意味著在樹的這個分支中,年收入是決定客戶選擇普通卡可能性的唯一因素。
將挖掘模型查看器切換到“依賴關系
網絡”選項卡,可以看到如圖2-54所示的界面,這是和“Member Card”的屬性關聯的客戶屬性依賴圖,通過拖動左邊的滑塊,可以發現,“Yearly Income”的確是影響會員卡類型的最重要的因素。

有了以上信息,市場部就可以確定最可能選擇某種類型卡的客戶的特征。根據這些特征(收入、子女數和婚姻狀況等),可以重新定義會員卡的服務和方案以便更好地適應其客戶。
到此為止,本章按照商業智能體系結構完成了從業務
數據庫到智能決策的整個過程,其間涉及到一些重要的技術,比如OLAP分析和數據挖掘等,只有對此深刻理解才能深入基于
SQL Server 2005的BI應用,在后面的章節中,將會以商業智能體系結構為框架,詳細講述這些技術。
文章來源于領測軟件測試網 http://www.kjueaiud.com/