青島市勞動和社會保障部門容災系統拓撲圖
青島市勞動和社會保障部門的信息系統目前采用的是全市大集中模式,隨著數據集中處理的進一步實施,勞動保障的業務運作、管理模式越來越依賴于計算機系統的可靠運行,各級勞動保障機構所提供服務的連續性以及業務數據的完整性、正確性、有效性,直接關系到社保業務的開展、管理與決策。
在這種情況下,對系統和系統數據的保護成為業務系統安全運行的關鍵。青島市勞動和社會保障部門經過評估和分析確定,對系統的核心網絡設備、服務器主機、數據庫、應用服務等關鍵的硬件設備、軟件應用等進行冗余保護和容災備份部署。
搭好安全防護網
青島市勞動和社會保障部門和項目實施方東軟軟件股份有限公司經過多次討論和協商決定,容災系統的實現主要通過對青島市勞動和社會保障局信息中心運維的后臺數據庫系統、中間件應用服務器系統、網絡系統以及POS系統進行冗余災難保護。
后臺主數據庫服務采用Veritas公司的容災綜合套件解決方案。通過Veritas 的VVR動態數據復制功能,實現關鍵數據的異地災難備份。通過Veritas的VCS本地集群和GCO遠程集群切換技術實現對數據庫應用的實時保護。
中間件服務器的災備分為兩部分,數據庫部分利用的是ORACLE 9i企業版具有的Dataguard遠程災備功能,TUXEDO中間件服務則采用程序的靜態移植方法。使用Dataguard功能,通過傳遞和應用數據庫歸檔日志,可以實現中間件服務器上的Oralce數據庫的數據同步。通過拷貝、重新編譯和配置將Tuxedo中間件服務移植到災備主機,可以實現中間件服務的冗余備份。這樣,對于主機系統,當單臺主機故障時通過本地切換保護,而當信息中心整個系統發生災難故障時,可切換到遠程災備中心,使業務系統迅速恢復。
網絡系統,通過配置在災備中心相同數量、相同性能和功能的核心網絡設備,建設連接災備中心的廣域網備份線路,實現網絡系統的災難備份。當生產中心核心網絡設備故障或廣域網線路故障時,均可切換到災備中心,繼續為整個業務系統提供網絡服務。網絡部分除了自身的冗余保護外,還是系統其他部分實現容災保護的基礎,其中包括增設一條從生產中心到災備中心的專用復制線路,以實現主機關鍵數據的動態復制。
POS系統,通過在災備中心配置的相同型號的NAC機、加密機,配合POS應用的后臺服務程序的克隆移植實現容災備份。
災備中心使用兩臺相同配置的IBM P650小型機,用作生產中心的兩臺數據庫服務器的災備主機,保護后臺主數據庫;一臺S7A用作生產中心兩臺H85中間件服務器的災備主機,保護中間件服務器上的Tuxedo中間件服務及其數據庫。一臺EMC CX700的存儲服務器(盤陣),用于中心數據的異地動態復制備份。加密機和NAC機以冷備方式提供系統加密和POS接入的容災保護。華為的網絡設備提供與中心的核心路由器和交換機的相同功能,并在發生災難故障時,由電信線路提供商進行廣域網線路切換,實現網絡的容災保護。一旦出現如火災、爆炸、雷擊或線路故障、電源故障、人為破壞等難以抗拒的災難性故障時,系統可以迅速、及時恢復,提高整個系統的可靠性,使社保系統更好地為市民服務。
安全服務遭遇五重山
青島市勞動和社會保障部門容災系統的方案雖然已經確定,但是擺在青島市勞動和社會保障部門和東軟軟件股份有限公司面前的問題卻是經驗少、時間緊、任務重、風險大等5方面難題:
首先,經驗少。
沒有可以借鑒的成功案例,東軟和Veritas公司都缺少可以借鑒的類似成功案例。Veritas公司的容災全套解決方案主要包括VM、VVR、VCS、GCO幾部分,對主機的硬件、操作系統、應用軟件等有較高的要求,對存儲系統也有特殊的配合要求。項目的實施準備在摸索中進行,也因為如此,項目的實施方案遲遲不能確定,對方案的質疑和求證花費了大量時間。另外,項目中缺少Tuxedo中間件方面的專業人員,對此部分容災備份系統的實施,存在一定不確定性。
其次,時間緊。
青島市勞動和社會保障部門社保系統是運行了多年的應用系統,除用于社保辦公系統、勞動力市場的人力資源管理辦公系統外,還有POS系統為青島市的所有醫院、藥店提供24小時服務,停機實施時間限定在國慶節的7天內,而主要設備的到貨時間卻由于種種原因比原計劃推遲,而到貨后又出現部分設備配件不符合系統環境需求的情況,導致實施前搭環境、測試等準備工作的時間非常緊張。
第三,任務重。
項目實施涉及的產品多,技術復雜,涉及的任務面廣而多,除硬件系統還涉及應用軟件系統,除主機系統,還有網絡系統、數據庫系統,除后臺應用,還有中間件前置服務等,除常規的硬件集成,還有很少涉及的加密機、NAC機等涉及POS系統的實施。
第四,基礎條件不足。
主要是青島市勞動和社會保障部門現有運行系統主要設備均已過保,而部分關鍵設備有造成系統癱瘓的嚴重隱患,比如EMC盤陣的控制器故障,三臺主機大光纖通道卡故障,以及缺少根系統備份硬盤及內置小磁帶機等,導致根系統備份的困難,這些都極大地提高了項目的實施風險。此外,POS系統相關配置信息的缺乏及對系統結構和工作原理的不了解,增加了整個系統的實施難度。
第五,風險大。
此次容災系統的實施,是為在用的生產系統建設容災保護,社保系統分三部分,一是社會保險服務辦公系統,二是勞動力市場的人力資源管理系統,三是服務于全青島市的醫院、藥店的POS系統。這三部分都與青島市民的生活密切相關,其中第3部分更是要24小時對外服務。實施過程的稍有不慎,都會導致系統數據的損失,如實施期間發生意外情況,又不能及時恢復原有系統的運行,將造成極大的社會影響。而即使在完成了容災系統的安裝配置后,進行應用測試時還有可能因測試導致數據的不一致或產生無效數據,影響系統的正常運行。
坦然迎接挑戰
針對經驗少問題,項目組采取了3方面舉措:一是將原有系統的各部分進行詳細調查, 把握生產系統的各方面信息;二是與各廠家工程師交流,探討涉及各個系統的方案實現;三是內部挖潛,通過集思廣議,共同努力解決。比如對Tuxedo的編譯處理等,就是社保軟件人員在缺少技術支持的情況下,自己研究摸索完成的。
針對時間緊問題,通過制定詳細的進度計劃,確定異常情況的應急措施,做好備份、克隆等準備,并在實施中遇到意外及時調整實施策略,保證了關鍵任務的順利實施。在領導及各職能部門的協調支持下,及時地解決不符要求的設備配件的更換。項目組成員明確分工、協調與溝通。
針對任務重問題,通過將任務分解,確定任務接口,明確項目組成員的分工,通過領導的協調,解決人員緊張問題,同時,在國慶節期間的關鍵任務實施,還從東軟總部調來了內援,這些都對項目的順利實施起到重要的作用。
針對基礎條件問題,也有了部分改進,主要是解決了關鍵的EMC CX600舊盤陣的控制器故障問題。
針對風險大問題,主要在系統備份、數據備份,應急措施的準備等幾方面下功夫。事實上,看似簡單的解決辦法,卻在實現中有許多要注意的部分,而其關鍵在于細節的把握和控制。
通過對5方面問題進行有針對性的解決,青島市勞動和社會保障部門容災系統得以順利完成。該系統的順利實施極大地提高了青島市勞動和社會保障局社保信息系統的可靠性和抗災難故障的能力,大大提高了系統的不停機維護能力,提高了整個社保系統的運行效率和對外的服務質量,從而提高了客戶的滿意度。
文章來源于領測軟件測試網 http://www.kjueaiud.com/
版權所有(C) 2003-2010 TestAge(領測軟件測試網)|領測國際科技(北京)有限公司|軟件測試工程師培訓網 All Rights Reserved
北京市海淀區中關村南大街9號北京理工科技大廈1402室 京ICP備10010545號-5
技術支持和業務聯系:info@testage.com.cn 電話:010-51297073
老湿亚洲永久精品ww47香蕉图片_日韩欧美中文字幕北美法律_国产AV永久无码天堂影院_久久婷婷综合色丁香五月