遼寧移動通信公司 齊兵 王曉明 電信運營商的綜合網管系統是提高企業核心競爭力,快速響應市場和客戶的重要手段,也是現代電信運營商管理模式的重要體現。網管系統建設和使用的好壞將直接影響運營商的長遠發展和在市場競爭中的地位。 建設綜合網管系統的意義在于,它保證了網管系統信息基于全網層面的全面、有效和完整,同時進一步提供企業合理有效的監控、維護、服務手段,解決現行管理問題,并提供一定程度決策分析支持等。作為中國移動IT支撐系統的主要組成部分及網絡維護管理的重要手段,綜合網管系統是實現中國移動運維管理目標的基礎和保障,在提供業務、保證網絡質量、降低網絡運營管理成本等方面發揮重要支撐作用。 一、存儲架構建設考慮 綜合網管系統作為關鍵業務應用系統,其連續運行和數據完整性是企業生存的命脈、發展的基礎,也是企業提高競爭力,為客戶提供更可靠服務,確保在日益激烈的市場競爭中確立主導地位的基本保證。因此,在數據大集中改革的前提下,對數據的存儲提出了更高的要求。 在構架企業級存儲環境時,遼寧移動綜合網管系統主要考慮了以下兩點。 1.海量數據的存儲與備份 綜合網管建立后數據累積的速度將會越來越快,且最終用戶需要快速訪問越來越多的信息,因此存儲管理已經從一種夜間操作任務變成全天候的關鍵任務。存儲管理包含與有效部署、可訪問性和跨計算基礎設施使用存儲信息有關的所有活動??梢哉f,存儲管理將會成為IT主管面臨的最重要的問題之一。 2.系統化管理與解決方案 在分布式計算環境中,IT主管需要穩定的跨企業存儲管理戰略和系統正規的流程形式。另外,存儲管理過程與集成網絡和系統管理(INSM)戰略不是彼此獨立的。IT主管需要能集成各種存儲管理技術和組件的完整解決方案,包括系統、數據庫、文件系統、存儲外設、存儲管理應用軟件及網絡及其系統管理方案。因此,環環相扣的一體化結構是存儲方案所必須的。 二、遼寧移動綜合網管系統存儲建設方案 基于以上的考慮,遼寧移動對綜合網管系統的存儲建設提出了以下需求。 1.數據集中化。集中化維護必然要求數據存儲與管理的集中,這種模式有利于各項業務間的聯動處理,并且有利于實現分級授權,加強控制和監督,提高集約化管理水平。 2.業務綜合化。集中化維護后各種業務緊密結合起來成為一個整體,各系統之間信息得以共享,消除了信息孤島,為數據挖掘與決策分析奠定堅實的基礎。 3.數據安全性。綜合網管系統作為數據高度集中的系統,數據的安全是第一位的。一旦系統出現故障造成數據丟失、系統中斷,由此造成的損失將不可估量。因此必須從網絡、操作系統、數據庫、存儲設備等方面建立起一套嚴密的保障措施,保證業務數據的100%可用。 4.保證系統高可靠性與高可用性。作為集中維護處理系統的數據備份是保證數據高可靠、高可用的基本手段。將綜合網管系統的數據進行實時備份,將大大提高數據資源的可靠性。 5.高可擴充性與升級能力。存儲系統一定要能夠適應網絡系統發展的需要,具備高可擴充性與升級能力。 在經過多次方案的論證,各種存儲架構的比較后,SAN(StorageAreaNetwork,存儲局域網)存儲架構由于其可建立高可用冗余,在不占用服務器CPU資源的情況下,備份和恢復完成速度很快,同時不會影響局域網帶寬,可以在端到端連接的服務器之間實現文件共享,其存儲的高度共享結構以及可以非常高效地進行擴展等優點,最終獲得了遼寧移動公司的青睞。遼寧移動綜合網管系統SAN存儲結構如圖1所示。 在圖1中我們可以看到,磁盤陣列(StorageWork)和磁帶庫(TapeLib)都接到了SAN的交換機上,這是一種徹底解決需要占用LAN網絡帶寬問題的解決方案。它采用一種全新的體系結構,將磁帶庫和磁盤陣列各自作為獨立的光纖結點,備份時,數據流直接從磁盤陣列傳到磁帶庫內,無需占用網絡帶寬。 為保證數據的安全可靠,對磁盤陣列內所有磁盤做了RAID0+1,這樣做雖然損失了一半的空間,但是提高了磁盤的性能和可靠性,這一點是我們更加關注的,而且存儲空間是可以擴充的,圖1中的DELLStorageWork就是為擴充存儲容量而接入的。 在服務器方面,我們選擇了當時比較高端的AlphaServerGS160,同時為確保服務可用,對兩臺GS160做了群集,采用這種高可用性群集解決方案,當整套系統中出現任何一個單點故障,都有相應的冗余部件代替發揮相應的功能,從而保證業務的正常進行,在此過程中的物理設備和應用軟件的切換都不會被前端用戶所察覺。另外系統的PCSERVER也采用了群集服務,這樣極大降低了業務在各種單點故障發生時的損失,保證業務系統的7x24小時不間斷運轉。 該方案實施后,不但滿足了遼寧移動綜合網管系統提出的需求,而且還取得了良好的效果。 首先,在高性能方面,由于該方案提供了和直接連接模式類似的性能,同時消除了傳統的網絡備份模式所特有的受網絡帶寬限制的缺陷,因此對于像遼寧移動這樣的大型網絡環境來說,是一個至關重要的有利因素。 其次,在可擴展方面,磁帶庫和磁盤陣列各自作為獨立的光纖結點并被所有的主機共享。系統容量可以很容易地通過增加額外節點來擴展,所以不管公司的業務規模如何擴展,此套系統都可以適應需要,既節省了投入資本,又不必費力重新規劃管理。 第三,在靈活簡便性方面,該系統的存儲空間可以隨著環境的改變隨時被分配和重新分配。備份容量也是一樣,像直接連接模式中一樣,磁帶驅動器是被指定或鎖定到特定的服務器上,這樣做的好處是為管理人員提供了方便,部署規劃更加明晰,所以說它是針對整個系統平臺一種分門別類的分配方案。 三、容災系統的建設 上述系統雖然能滿足移動公司的業務需求,但是還存在一個問題:在當時系統建立時,由于受環境因素的影響,只是對系統做了冗余,并未對系統做異地容災,這不能不說是一個缺憾,同時也是系統的一大隱患。目前由于綜合網管系統在日常生產中扮演越來越重要的角色,同時為了滿足對海量數據的分析,為領導層提供決策分析支持,為用戶提供更優質的服務,遼寧移動正在建設新的方案對系統進行升級和異地容災。 隨著IT技術的飛速發展,現今的設備在性能上已遠遠超過當年公司采購的系統,遼寧移動備份升級方案的主導思想是,以當前的系統作為備份,用性能更好的設備組建一套新系統,兩套系統實現SAN-SAN的異地容災方案。 新的容災方案實施以后,系統的性能和可靠性、安全性都得到了很大的提高,其結構圖2如示。 在競爭日益激烈的通信市場,爭奪用戶的競爭將是運營商提供服務的競爭,只有通過對歷史數據的深度挖掘、分析,作出正確的決策,才能領先對手為用戶提供優質貼心的服務,才能在市場上占據主導地位。存儲系統作為綜合網管的最底層設備,為數據深度挖掘和分析提供堅實的基礎和保障。遼寧移動正是基于這一目在不斷建設和完善自身的存儲系統。我國古文化《易經》中曾經這樣來描述大地:“地勢坤,君子以厚德載物”,在這里來形容存儲系統看來也是很恰當的。
圖1綜合網管系統的SAN結構圖
圖2 SAN-SAN 異地容災結構圖