• <ruby id="5koa6"></ruby>
    <ruby id="5koa6"><option id="5koa6"><thead id="5koa6"></thead></option></ruby>

    <progress id="5koa6"></progress>

  • <strong id="5koa6"></strong>
    • 軟件測試技術
    • 軟件測試博客
    • 軟件測試視頻
    • 開源軟件測試技術
    • 軟件測試論壇
    • 軟件測試沙龍
    • 軟件測試資料下載
    • 軟件測試雜志
    • 軟件測試人才招聘
      暫時沒有公告

    字號: | 推薦給好友 上一篇 | 下一篇

    使用 Microsoft SQL Server 2000 和 Windows 2000 Datacenter Server 實現分布式數…

    發布: 2010-6-18 08:16 | 作者: 網絡轉載 | 來源: 領測軟件測試編輯 | 查看: 245次 | 進入軟件測試論壇討論

    領測軟件測試網

    活動管理工廠運行 SQL 存儲過程大約需要 12 天的時間,同時對 ODS 派生的數據庫應用業務規則和數據轉換。

    決策支持工廠執行完 SQL 代碼之后,該工廠將使用 SQL Server 備份工具和共享驅動器資源,將它的數據庫傳輸到兩個不同的決策支持服務器。然后,每個決策支持服務器將還原包含在共享驅動器資源中的數據庫,這將使數據集市可用于活動管理和報告目的。圖 6 說明了該數據流。


    圖 6 Microsoft CRM 和 DSS 分布式數據倉庫的物理結構和數據流

    集成

    分布式數據倉庫集成了 30 多種不同的、來自公司內部和外部的數據饋送。這些數據饋送代表了美國客戶與 Microsoft 建立聯系的許多種不同方法,包括產品注冊、新聞快遞訂閱、事件注冊和更改地址。數據倉庫將來自每個數據源的信息與單個客戶和帳戶以及單個名稱和地址一一對應。

    數據倉庫還與內部業務系統(例如 MS Sales 和 World Wide Events 系統)進行集成。MS Sales 是包含分銷商、零售商和客戶銷售相關信息的數據倉庫。通過從 MS Sales 獲得數據,分布式數據倉庫可以提供有關公司贊助的活動如何影響購買決策的相關信息。集成 MSSales 目的是為了幫助決策者確定參加事件和訂閱新聞快遞是如何影響客戶做出第二次或第三次購買決定的。通過從 World Wide Events 系統獲取數據饋送,數據倉庫得以維護有關客戶注冊到公司贊助事件的最新信息。

    實施

    實施數據倉庫涉及到設計邏輯和物理結構、部署 SAN、安裝 SQL Server 2000 和 Windows 2000 Datacenter Server,以及配置 Microsoft Cluster Service 和第三方提供的軟件。目前,設計人員正在分階段實施分布式數據倉庫。他們在 1999 年 11 月和 2000 年 8 月分別完成了第 1 階段和第 2 階段的工作。編寫本文時正在實施第 3 階段。

    第 1 階段包括部署倉庫的物理和邏輯基礎結構,并開發決策支持的用戶界面。在該階段,設計小組將數據源限制為僅三或四個,以便限制數據倉庫需要處理的數據量。

    也是在第 1 階段中,決策者開始看到數據倉庫可能獲得的信息種類,并開始在進入下一個實現階段之前提供反饋,F在,大約 30 個分支機構是在第 1 階段中所實現的功能的定期用戶。

    在第 2 階段中,通過從大約 30 多個數據源添加數據,工程師顯著擴展了數據倉庫的規模。他們還實現了更健壯的數據處理和驗證環境、Trillium 匹配環境和支持管理活動的數據工廠。

    編寫本文時,CRM 數據集市中的數據被限制為居住在美國的客戶。DSS 數據集市包含美國客戶的數據以及部分全球數據。工程師使用美國客戶作為數據倉庫的初始數據集合,因為它是所有 Microsoft 客戶數據集合中最大的。同樣,小組考慮到在開始合并其他地區的數據集合(這是現在正在進行的第 3 階段的一部分)之前,它是進行壓力測試的有效基礎。

    實施數據倉庫還涉及到用 SQL 編寫自定義的業務規則和算法,這是其中一個需要持續和專門的工作以使分布式倉庫獲得成功的實施領域。因此,本討論將幫助讀者了解有關實施領域,它們需要數據倉庫設計小組使用 SQL 但不包括實際源代碼。(注意,該討論假設讀者已經熟悉數據倉庫術語、基本編程概念和關系數據庫的構建。)

    數據加載

    在將粒度數據轉變為適合于公司業務決策的信息的過程中,首先是將數據加載到操作數據存儲 (ODS) 中。ODS 是基于 SQL Server 2000 的維度模型,它不是實體關系數據庫 (ERD),并且采用星形構架格式。ODS 的作用是使輸入文件均質化,以便以后生成報表。

    數據將按照客戶郵政代碼,從超過 30 個不同的數據源加載到 ODS 中。它們包括產品注冊卡、事件注冊卡、客戶調查、電子產品注冊和由 Dun&Bradstreet 提供的某些其他數據(例如,當前郵件地址和任何合法名稱更改的數據)。加載之后,每個數據源的數據將被映射到常用輸入字段,然后經過驗證、與倉庫中現有記錄進行匹配,然后使用編輯優先級進行存儲。

    最多可以并發運行 18 個 SQL 加載作業。必須并發運行作業,才能支持每天加載到 ODS 的記錄數。

    數據驗證

    數據驗證的第一步是確認每個輸入文件均包含適當的列數,并且每個列均正確地位于文件中。"Do Not Load" 標記用于標識那些應當從加載過程中排除的列。

    所有被拒絕的記錄均設置為能夠手動審閱。在將每條記錄加載到倉庫中之前,要對每個電子郵件別名進行語法驗證。

    包含在每個地址中的州和省的代碼則通過與存儲的地理分類信息進行比較而得到驗證。與該分類信息不符的值將會保留并作為自由文本加載。

    自由文本字段將對照 "unacceptable values" 表進行比較。該過程用來檢查由使用 Internet 的任何人所提供的自由文本數據。該過程還用來驗證并確認自由文本是否適合于進行長期存儲和生成報表。

    標準化和匹配

    當現有客戶注冊第二個或第三個產品時,數據倉庫將使用標準化和匹配來使客戶與數據庫中某個已有項關聯。為了支持特殊情況,數據倉庫設計人員在 ODS 中實施了他們自己的匹配編碼算法。

    ODS 按國家/地區識別記錄,而這些記錄通過使用第三方軟件實現標準化。一旦可以使用第三方軟件,則可以將它用于進行地址匹配。某些情況下,在 ODS 中使用的是匹配編碼技術。

    對名稱,例如“Bill”和“William”,進行標準化處理,以便當 Bill 和 William 是同一個人時,該情況會反映在數據倉庫中。GEO 編碼用于將郵政代碼與給定的城鎮、街道關聯。GEO 編碼功能由第三方軟件提供。

    有時候,地址記錄會發送給美國郵政管理局,以確定地址是否已經更改。如果更改,將使用新地址。

    大多數數據源的數據首先將經過匹配數據并刪除任何重復的處理。下一步,數據被傳遞給第三方軟件,對名稱和地址進行標準化處理,以便在郵政代碼丟失的情況下提供名稱和地址。在客戶名稱與倉庫中現有記錄關聯后,包含重復客戶名稱和地址的記錄將加載到倉庫中。數據通過標準化和匹配處理之后,將使用編輯優先級存儲在 ODS 中。

    標準化和匹配為 Microsoft CRM 和 DSS 數據倉庫提供了許多重要的優點:

    • 它們幫助維護單個客戶記錄的唯一性。
    • 它們確保加載到數據倉庫中的任何額外數據(例如,訂閱、注冊、事件參與)能夠與正確的客戶相匹配。
    • 它們幫助保持地址和電話號碼準確并及時更新。

    編輯優先級

    編輯優先級是使用 SQL 開發的,用來按統計方式在字段級別對數據源進行分級,這對長期提高倉庫中數據的準確性非常重要。每個數據源中的每個字段都會收到一個級別,指明包含在該字段中的數據的統計準確性。某些數據源提供非常準確的數據,而其他數據源提供的數據則不太準確。每個數據源都會提供一些唯一的信息,以及一些許多數據源共有的信息。系統將需要所有可用數據源的所有可用字段來建立反映每個客戶的綜合情況。

    要判斷哪些數據源中的哪些字段將提供能夠反映每個客戶的最準確情況的數據,編輯優先級解決了這一問題。例如,當每個字段中的數據保存到數據庫時,將使用該字段記錄數據源。通過記錄為每個字段提供數據的數據源,編輯優先級將確定什么時候將不太準確的數據源提供的數據替換為更準確的數據源所提供的數據。如果需要,該方法還支持替換給定數據源所提供的所有數據。

    數據倉庫設計人員使用編輯優先級來生成幫助他們捕捉數據項錯誤(這在所有數據源中都是常見的)的統計結果,以便確定哪些數據源和字段更準確或不太準確。例如,一個數據源可能提供了過時的地址,而另一個數據源則可能無法反映最近的名稱更改。因此,利用編輯優先級,倉庫設計人員就可以確定最好使用第二個數據源的地址字段和第一個數據源的名稱更改字段。

    表 2 提供了如何使用編輯優先級的示例。字段 1、2、3、4 和 5 分別由數據源 1、3、2、3 和 1 提供。在該示例中,需要有三個數據源來提供數據的五個字段。字段 4 和 5 最初由包含低級別字段的數據源提供。利用編輯優先級,按照編輯優先級的定義,預期的結果是字段 4 和 5 中的數據將替換為包含更高級別字段的數據源的數據。

    表 2 使用三個數據源的編輯優先級示例


    字段 1
    字段 2
    字段 3
    字段 4
    字段 5
    數據源 1

     

    3

     

    1

     

    1

     

    0

     

    1

     

    數據源 2

     

    2

     

    2

     

    3

     

    0

     

    0

     

    數據源 3

     

    1

     

    3

     

    2

     

    1

     

    0

     

    編輯優先級為 Microsoft CRM 和 DSS 數據倉庫帶來了很多重要優點:

    • 它通過消除一個或多個數據源從而節約了成本。
    • 它使字段級別的數據隨著時間推移變得更可靠。
    • 它簡化了將一個數據源的數據替換為另一個數據源的數據的過程。

    主要記錄類型

    ODS 包含兩個主要記錄類型:基于個人的記錄和基于組織的記錄;趥人的記錄是指已經購買至少一個產品、參加至少一個事件或者訂閱至少一個聯機新聞快遞的單個客戶;趥人的記錄是由居住地址標識的,通常不包含組織名稱。

    基于個人的記錄提供對多個電子郵件別名的支持,包括每個別名的數據源。家庭鑰匙用于將單個客戶都放在相同的物理位置。

    基于組織的記錄是指企業、公司、機構或部門。如果基于組織的記錄按一定關系與基于個人的記錄關聯,則該記錄將加載到倉庫中。

    電話號碼與基于個人的記錄關聯,但不與基于組織的記錄關聯。數據供應商按周期提供新的電話和傳真號碼,以使它們及時得到更新。電話號碼與現有的傳真號碼關聯,以確保甚至在傳真號碼更改之后客戶的首選項也會被保留下來。如果需要,可以設置一個標記,以將電話號碼與公司的主辦公室關聯。抑制標記則包含每個客戶的聯系首選項。例如,可以設置一個標記來表示不要通過傳真進行聯系。

    工廠處理

    “工廠處理”是 Microsoft 內部使用的一個術語,應用于在多個計算機之間分布 ODS、業務規則應用程序和數據集市。工廠處理是由數據倉庫設計小組使用 SQL 開發的自定義過程,它是 Microsoft 內部倉庫特有的分布式性質。

    工廠處理用于定期地從 ODS 提取數據,以便在通過生成新的數據集市發布經過提煉的非規范數據之前,執行轉換、聚合、派生和分區。使用數據集市,決策者可以深入研究和分析單個客戶的事物、生成報表并支持活動管理的活動。圖 7 說明從 ODS 到工廠處理的數據流。


    圖 7 工廠處理的數據流

    工廠處理為 Microsoft CRM 和 DSS 數據倉庫帶來了許多重要優點:

    • 它提供了將倉庫擴展到 1 TB 以上的有效方法。
    • 它使服務器能夠執行更專門化的處理。
    • 它簡化了根據需要實施額外服務器的過程。

    數據集市

    數據集市是基于 SQL Server 2000 的數據庫,經過優化可以有效地生成報表。工廠處理每周生成新的數據集市。數據集市提供了強大的決策支持和活動管理環境。

    一旦數據集市已經生成,將使用內部開發的應用程序和第三方應用程序的組合,來獲取數據并以圖形方式將其顯示在圖形用戶界面中。圖形用戶界面允許決策者清晰地查看數據并加以分析。例如,可以使用一個圖形用戶界面從四個數據集市獲得數據,這將允許決策者“剝離”數據層,然后向所有的目標用戶完全公開。這樣做將使決策者能夠更好地了解哪些產品、新聞快遞和事件是不同目標用戶的首選項。

    倉庫設計人員在數據集市中使用了四個透視系數,以使決策者更容易訪問信息。這些透視系數是客戶數據、產品注冊、聯機訂閱和客戶事件。

    客戶數據透視系數

    客戶數據透視系數按照地理、配置文件、興趣和帳戶活動,為決策者提供了單個客戶和組織的綜合情況。該透視系數提供包含交叉活動分析在內的復雜查詢,包括對個人和組織的配置文件的分析。透視系數將根據正在使用哪些虛擬透視系數,計算個人和組織的數量。

    兩個虛擬透視系數基于客戶數據透視系數:個人和組織。這些虛擬透視系數類似于基本客戶數據透視系數,但虛擬透視系數可以根據指定數目的個人和組織生成報表,而基本透視系數不能。

    圖 8 說明事實數據表的一小部分以及數據集市的客戶數據透視系數中的一些相關維度。


    圖 8 可供公司決策者使用的數據集市信息的示例

    產品注冊透視系數

    產品注冊透視系數將產品注冊事務存儲在基于時間的視圖中。該透視系數的首要用途是確定單個客戶長期的產品注冊趨勢。默認查詢為財務月、分支機構、銷售地點、產品名稱和產品注冊計數。

    聯機訂閱透視系數

    聯機訂閱透視系數將聯機訂閱事務存儲在基于時間的視圖中。該透視系數的首要用途是確定單個客戶長期的聯機訂閱趨勢。對于與新聞快遞相關的活動,透視系數包含所有訂閱和取消訂閱活動,包括單個個人的多個訂閱或取消訂閱操作。

    客戶事件透視系數

    客戶事件透視系數將關于客戶事件的活動信息存儲在基于時間的視圖中。該透視系數的首要用途是查看長期與特定事件聯系的客戶活動。該透視系數將計算個人邀請、注冊、確認和事件參與的數量。

    支持

    本文下一節將詳細說明由數據倉庫小組用來監視和維護系統的一些比較重要的支持工具。

    這些工具可以主動幫助收集某些信息,這樣,如果問題發生則可以使用該信息找到潛在的原因,當問題發生時它們還會收集其他信息。主要支持工具包括 Windows 2000 性能監視器、Windows 2000 事件查看器、基于 SQL Server 的電子郵件、Windows 2000 終端服務和 SQL 代碼。

    Windows 2000 性能監視器

    Windows 2000 性能監視器包含在 Windows 2000 Professional、Windows 2000 Advanced Server 和 Windows 2000 Datacenter Server 中,它用于找到由系統或軟件組件所導致的性能瓶頸。性能監視器的輸出結果以圖形方式顯示,并且支持同時查看多個系統組件和應用程序進程。性能監視器是操作小組用來確定進程或應用程序是否分配了太多內存或者使用了太多處理器時間的首要工具。

    當需要調整系統性能時,由性能監視器提供的數據對于分析和操作小組具有相當高的價值。在 Microsoft,只有服務器管理員可以運行性能監視器,因為經驗顯示,當需要時該信息可以隨時從一臺計算機獲得并在分析人員中間共享。經驗還顯示,通過限制用來同時查看性能數據的計算機的數量,可以略微提高性能。在 Microsoft,該數字很少超過五。

    從使用性能監視器開始來啟動性能分析有很多理由,其中主要的原因是重要的處理過程開始時需要使用比過去更多的時間來完成。某個小組做出啟動性能分析的決定,并負責在幾臺專門用于該用途的計算機上收集性能數據。按照科學的方法所收集的數據有多有少,并且在運行懷疑過程時進行收集。管理員將添加所有性能計數器(除了用于網段的計數器),并將結果以日志的方式記錄在磁盤上,保留時間為 48 到 72 個小時。然后,他們將日志文件傳遞給分析性能數據的分析支持人員。

    性能監視器還用于利用內存、CPU 和磁盤計數器系統地覆蓋性能計數器,目的是為了確定可能導致特定性能問題的進程。根據分析結果,通過添加更多硬件、調整 SQL 作業的時間設置或者將資源密集型進程移動到另一個服務器上,通常即可解決性能問題。

    事件查看器

    通常,SQL Server 2000 和 Windows 2000 Datacenter Server 會將事件消息寫入每個服務器上的應用程序日志和事件日志中,而事件查看器則基于這些事件消息顯示相應的信息。每個事件消息都有相應的 ID,使用該 ID 可以確定很多常見問題的性質和嚴重程度,例如磁盤已滿、硬件設備故障或者進程耗盡內存。通過事件查看器,數據庫管理員 (DBA) 可以使用事件 ID 搜索 Microsoft Knowledge Base(http://search.support.microsoft.com/kb/c.asp?ln=en-us),以便更詳細了解產生特定問題的可能原因。

    基于 SQL Server 的電子郵件

    在 Microsoft CRM 和 DSS 數據倉庫中,操作小組依靠基于 SQL Server 的電子郵件來跟蹤 SQL Server 2000 活動情況; SQL Server 的電子郵件被配置為定期地將通知發送給生產小組,使他們能夠對系統內部情況有所了解。

    問題需要立即處理時,基于 SQL Server 的電子郵件還可用來自動呼叫生產支持小組中的某個成員。從代碼位置(該位置保證用電子郵件聯絡生產小組)用程序調用擴展 SQL 存儲過程 XP_SendMail,數據倉庫以此方式啟動基于 SQL Server 的電子郵件。

    Windows 2000 終端服務

    操作小組的成員使用 Windows 2000 終端服務(它是 Windows 2000 Datacenter Server 的一部分)來進行遠程操作。利用終端服務,任何位置上的操作人員都可以像正在系統控制臺一樣,安裝和配置 SQL Server 2000 以及排除有關故障。

    SQL

    ODS、工廠和數據集市服務器所使用的許多過程都是使用 SQL 開發的。在每個過程中,設計小組都使用了診斷代碼,這些代碼可以用來連續跟蹤信息,幫助倉庫操作人員確定倉庫內部的當前情況。各種信息(例如,進程識別號和完成每個存儲過程的所需時間)將連續寫入基于 SQL 的表中,以便用于生成報表?梢噪S時查看包含在表中的信息,以便從 SQL 角度確定系統當前的運行情況。所記錄的信息使得開發人員能夠觀察一段時間后的性能,并計劃增加額外的容量。

    最好的做法是,將 SQL 進程中所生成的消息記錄到文件中,因為很多作業會需要很長的運行時間。這些作業將連續生成通知消息,經驗顯示,將這些消息記錄到文件中可以有助于確保顯示長度將不會被超過。

    支持群集資源

    在類似分布式數據倉庫的系統中,時間設置是數據流的關鍵因素,因此了解如何支持群集資源是非常重要的。在倉庫中,七臺服務器群集在一起以便共享磁盤資源。這七臺服務器中的每一臺均有自己的本地存儲器,還有由 Microsoft Cluster Service 和 SAN 創建的全局存儲器。如果服務器需要從全局存儲器讀取數據,則服務器將請求包含數據的群集磁盤資源。如果服務器需要將數據寫入全局存儲器,則服務器請求要將數據寫入其中的群集磁盤資源。

    數據倉庫設計人員實施數據倉庫以便來自 SQL Server 2000 的共享磁盤資源請求可以使用 SQL。當服務器執行 SQL 代碼時,代碼中有一行指令 Microsoft Cluster Service 為該服務器分配磁盤資源的語句,但該語句將在最后執行。

    這種實施方法并不是由數據倉庫設計人員首先提出來的。一開始,他們嘗試通過調用多個服務器上的 cluster.exe 來分配磁盤資源。但該方法效果不好,因為它意味著要將共享的驅動器資源從服務器中取走,而同時 SQL Server 正在從中讀取數據或向它們寫入數據。因此,生產支持小組介入工作后,通過使用 SQL 語句開發出共享的驅動器接口,從而解決了該問題。驅動器接口被用作鎖定機制,以便共享的磁盤資源不會脫離正在使用它們的服務器。需要共享驅動器資源的服務器將調用該驅動器接口代碼,然后轉入 SQL 等待循環,直到故障轉移應用到該驅動器。

    通過將該信息記錄在表中,驅動器接口代碼將跟蹤共享的磁盤資源。驅動器接口代碼是調用 cluster.exe 的唯一位置。使用倉庫中共享磁盤資源的所有服務器都通過該公共接口執行調用。

    安全

    系統實施了嚴格的安全措施來確保 CRM 和 DSS 數據倉庫中客戶數據的機密性。安全措施包括(但不限于)保護數據倉庫的物理硬件以及計算、網絡和軟件組件。為了保護客戶數據的機密性而設置的工作程序也得到嚴格執行。

    對物理硬件的訪問受服務器的放置場地限制,并且受獲得合適密鑰卡和培訓的可信任人員的人數限制。設備每天 24 小時每周 7 天均受到錄像監視。限制網絡訪問的方法是,將網絡與 Internet 隔離并且用戶在登錄到網絡前需要 Active Directory™ 服務身份驗證。倉庫中的每個服務器均使它的文件系統受到訪問控制列表 (ACL) 的控制,以確保先要由 Active Directory 做進一步身份驗證,然后才能訪問文件系統。

    SQL Server 2000 Enterprise Edition 保護每個數據庫中的客戶數據的方法是,要求內部 CRM 倉庫用戶獲得特殊的帳戶,并且使用 Active Directory 對這些帳戶進行身份驗證。

    按照 CRM 倉庫的設計,決策者通過數據集市來訪問客戶數據。根據每個決策者的工作范圍限制他們對數據集市中敏感數據的訪問。例如,不需要進行管理活動的決策者只有一定的訪問權限,這樣他們只能執行分析而不能實際獲取包含客戶名稱和地址的列表。

    建立小組

    為規劃和實施 Microsoft CRM 和 DSS 分布式數據倉庫,公司根據個人在六個獨立領域所掌握的知識和技能,建立一個關系平等的工作小組,這六個領域是:存儲工程、生產管理、程序管理、設計、測試和生產支持。圖 9 說明了參加設計、實施和部署分布式 CRM 和 DSS 倉庫的小組。

    crmdss9

    圖 9 負責部署數據倉庫的小組

    存儲工程

    要求。該項目需要能夠設計和實施大型 SAN 的存儲工程專家。他們要求能夠部署后端設備,使設計人員能夠將數據倉庫擴展到極大比例。存儲工程師還要能夠為其他小組成員提供有關建議,幫助他們有效地支持使用 Microsoft Cluster Service 的環境。

    人員。兩個存儲工程師加入小組,并帶來他們在邏輯單元數 (LUN) 隱蔽方法、存儲區聯網、硬件基準設定和 Windows 2000 Datacenter Server 方面的專業知識。

    生產管理

    要求。項目需要完全了解業務要求并幫助確保倉庫以后達到公司目標的人員。這些人員需要能夠面對公司決策者,并獲得他們認為非常重要的信息要求。

    在尋找能夠擔任產品經理的人選時,公司領導尋找有能力詳細說明復雜的業務過程流、確定數據源和技術結構、并制作和完成相關技術說明的人員。產品經理還應當擁有 Microsoft 產品經驗,包括 SQL Server 2000、Windows 2000 Advanced Server 和 Microsoft Office。

    人員。符合上述要求的幾個人選作為產品經理加入小組,幫助推動重大計劃的實施。通過確定產品的特性和功能以及收集和分析業務要求和產品戰略,使注重結果的技術專業人員得到啟發。他們還負責委派工作任務、主動將要求融入到產品規劃過程中、收集用戶反饋并推動倉庫設計的工作。

    程序管理

    要求。項目需要的人員能夠根據復雜的倉庫設計及部署的要求,按照正常進度表和包含數百個不同步驟的項目計劃來執行工作。這些人員需要隨時跟蹤所有項目相互依賴關系,并把業務要求詮釋為功能規范、過程流和數據模型。

    在尋找能夠擔任程序經理的人選時,項目領導尋找在信息技術方面具有五年管理經驗、提供技術支持并能夠同時執行協助和管理任務方面的人員。他們還要尋找具有客戶端/服務器計算知識、優秀的書面及口頭表達能力并且熟悉 Microsoft 產品(包括 SQL Server 和 Windows 2000 Datacenter Server)的人員。

    人員。符合條件的幾個人作為程序經理加入到小組中,他們幫助確定了開發時間期限、分析業務要求、制定帳戶管理策略并管理跨部門的小組,以實現共同目標。這些人員通過與內部小組合作設計、開發和實施數據倉庫,幫助推動項目進行。在管理小組成員之間的關系并建立強大的團隊組織的同時,他們通過交流業務問題、可選方法和項目策略,為不同的工作小組提供意見。

    設計

    要求。在尋找負責處理數據倉庫的設計的人選時,項目領導需要關系型星形構架、加速表和聚合方面的專家,并且候選人能夠使用 SQL 實施高度有效的代碼。

    人員。倉庫設計人員是小組中目前最了解技術的人員。他們遵循規范設計出維護方便的代碼,同時擅長在時間壓力下開發出中度到高度風險的業務解決方案。他們負責按照項目目標和要求成功完成項目,并且能夠向其他小組成員解釋設計要求、功能集和功能。

    這些人員擁有很強的書面和口頭交流技能、出色的技術能力、對軟件開發過程的深入了解、以及與程序經理、測試人員和生產支持人員密切合作的能力。此外,他們曾經廣泛使用過 Microsoft SQL Server,有關系型和邏輯型數據庫設計、SQL 編碼和性能調整的經驗,并且懂得 COM+/DNA、OLE、XML/XSL、MTS、Visual Basic® Scripting Edition (VBScript)、JScript® 開發軟件、Visual Basic、DHTML、ASP、ADO 以及 Internet Information Service(Windows 2000 Server 中的 Web 服務器)。

    測試

    要求。要確保所有功能都不會造成數據倉庫不穩定,項目領導需要有足夠的測試人員,在開發每個新組件的同時對其進行測試。測試人員需要精通數據倉庫的各個方面,并保證項目“零缺陷”。他們需要以非常嚴格的方式分析和復現可能影響倉庫穩定性的任何問題,以便倉庫設計小組能夠快速解決這些問題。

    人員。測試人員要與設計人員密切合作,以防止出現問題并使產品更能經受測試。通過分析規范并編寫測試倉庫、用戶界面和數據庫功能的自動腳本,他們定義和執行測試步驟。測試人員還擁有出色的測試技能、對軟件開發和 SQL Server 的深入理解以及分析Active Server Pages 和 SQL 中代碼更改的能力。

    生產支持

    要求。項目需要負責為正在進行中的日常生產提供支持的人員,確保簡單的問題在可能對數據倉庫總體產生負面影響之前得到及時解決。其他需要的重要技能是能夠排除故障、能夠根據有限信息快速解決問題、以及能夠開發專門用于數據倉庫支持的監控技術。

    人員。對數據倉庫提供生產支持的人員廣泛熟悉 Microsoft 產品,包括 Windows 2000 Datacenter Server、Windows 2000 Advanced Server 及其 Web 服務器 (Internet Information Service) 和 SQL Server 2000。他們一般能夠用 VBScript、JScript 和/或 Windows NT® Batch 開發命令行腳本。他們還了解 SQL 優化和編碼技術;熟悉 C++、網絡基礎和系統調整及時間設置;并且是故障排除專家。

    生產支持人員還要與網絡工程師、存儲工程師、開發人員、測試人員、程序經理以及包括數據庫管理員在內的操作小組密切合作。他們擁有管理和解決問題的技能,并且具有迅速掌握新技術的能力。

    經驗教訓

    在確定 Microsoft CRM 和 DSS 數據倉庫獲得成功之前,負責設計、部署和支持該倉庫的小組遇到了許多問題和挑戰。下面是一些主要的經驗教訓:

    實際需要歸檔的記錄很少。一開始,設計人員相信數據歸檔會是倉庫設計的一個重要方面。隨后他們發現,實際上只有少量的記錄需要歸檔,并且處理這些記錄的最好方法是利用數據抑制。

    最好使用 Unicode。設計人員現在相信,他們應當在原始設計中更好地使用 Unicode。他們相信,假如在整個設計中廣泛實施了 Unicode 支持,現在他們可能發現支持多個代碼頁會更容易。

    在計算機之間復制數據庫缺少伸縮性。一開始,生產支持小組在計算機之間復制 SQL Server 數據庫,以便幾個運行 SQL Server 的計算機會共享某些數據。但隨后他們發現,在網上復制數據庫占用太長的時間,而使用 SAN是在計算機之間共享數據的更好方法。使用 SAN,數據將以最高每秒 100 MB 的速度通過光纖通道和硬件主干道直接寫入磁盤。使用 SAN 在服務器之間移動數據,可以將在服務器之間傳輸數據需要的時間從三天多減少到僅幾個小時。

    時間設置對于保持數據移動很重要。在實施初期,生產支持小組擔心,當試圖使用共享磁盤資源來共享數據時,群集磁盤爭用可能導致問題。為了消除這一顧慮,小組成員開發了一個 SQL 進程,它通過提供這些資源公共接口來跟蹤和管理共享磁盤資源的分配情況。在該進程的幫助下,要求訪問共享磁盤資源的服務器只要調用該公共接口即可獲得該資源。要求訪問共享卷的服務器將把請求提交給自定義的應用程序,然后轉入 SQL 等待循環,直到故障轉移應用到驅動器。公共接口可以防止倉庫中的服務器從另一臺正在將數據寫入驅動器的服務器那里移走共享驅動器陣列。

    存儲工程是一項必要工作。很多年以前,ITG 并沒有自己的專業存儲工程師小組,F在,存儲工程師必不可少,并定期部署基于 SAN 的解決方案,以便跟上公司不斷增長的信息要求。

    結論

    小型、中型和大型公司的決策者都同樣地要依賴于某種形式的準確和及時的信息,這些信息的形式能夠使他們保持或重新獲得處理業務的敏捷性。他們必須快速擁有所需信息,才能順利調整他們的業務過程,以響應不斷變化的市場條件,才能了解客戶要求,管理并培育有價值的客戶關系。

    Microsoft 已經設計和部署了分布式數據倉庫,目的是要獲得對客戶更全面的了解,并以此提高客戶的滿意度和忠誠度。通過在本文中介紹 Microsoft CRM 和 DSS 數據倉庫的項目,ITG 希望它的有類似目的的客戶能夠獲得一個參考范例。

    延伸閱讀

    文章來源于領測軟件測試網 http://www.kjueaiud.com/

    22/2<12

    關于領測軟件測試網 | 領測軟件測試網合作伙伴 | 廣告服務 | 投稿指南 | 聯系我們 | 網站地圖 | 友情鏈接
    版權所有(C) 2003-2010 TestAge(領測軟件測試網)|領測國際科技(北京)有限公司|軟件測試工程師培訓網 All Rights Reserved
    北京市海淀區中關村南大街9號北京理工科技大廈1402室 京ICP備10010545號-5
    技術支持和業務聯系:info@testage.com.cn 電話:010-51297073

    軟件測試 | 領測國際ISTQBISTQB官網TMMiTMMi認證國際軟件測試工程師認證領測軟件測試網

    老湿亚洲永久精品ww47香蕉图片_日韩欧美中文字幕北美法律_国产AV永久无码天堂影院_久久婷婷综合色丁香五月

  • <ruby id="5koa6"></ruby>
    <ruby id="5koa6"><option id="5koa6"><thead id="5koa6"></thead></option></ruby>

    <progress id="5koa6"></progress>

  • <strong id="5koa6"></strong>