字號: 小 中 大 |
推薦給好友
上一篇 |
下一篇
開源監控工具Nagios使用介紹
發布: 2009-2-23 18:38 |
作者: 田逸 |
來源:
測試時代采編 |
查看: 2373次 | 進入軟件測試論壇討論
主機組配置文件hostgroups.cfg,這是一個可選的項目,它建立在文件hosts之上,其格式如下:
define hostgroup {
hostgroup_name sa-servers
alias sa servers
members nagios-server,24-25,24-26 //用逗號間隔多個主機
} |
多個主機組依上面的格式逐個追加上去。后面給一個主機組的截圖。
千辛萬苦,終于把這些配置給做好保存,現在幾乎有點迫不及待了,運行程序/usr/local/nagios –v /usr/local/nagios/etc/nagios.cfg來檢查所有配置文件的正確性。如果十分幸運的話,運行完畢將在輸出尾部出現
Total Warnings: 0
Total Errors: 0
Things look okay - No serious problems were detected during the pre-flight check |
這樣的情況,大功告成;但我卻沒有這么幸運,修改了好多個地方才成功。不過值得慶幸的是,這個校驗的錯誤報告時非常有用的(不象有的系統的幫助文檔中看不中用)?次夜室庠O置的一個錯誤產生的輸出:
[root.netmonitor nagios]# bin/nagios -v etc/nagios.cfg
Nagios 2.5
Copyright (c) 1999-2006 Ethan Galstad (http://www.nagios.org)
Last Modified: 07-13-2006
License: GPL
Reading configuration data...
Error: Could not find any host matching 'nagios-server'
Error: Could not expand member hosts specified in hostgroup (config file '/usr/local/nagios/etc/hostgroups.cfg', starting on line 2)
……………………… |
它告訴我配置文件在什么位置產生錯誤(實際上我故意在配置文件里加了一個注釋符號來測試)。驗證通過以后,就可以執行命令/usr/local/nagios –d /usr/local/nagios/etc/nagios.cfg 把nagios作為守護進程。然后用ps –aux | grep nagios 看進程是否處于運行狀態。到這一步,nagios服務基本上算是配置完畢。做hosts.cfg、services.cfg等配置時,可以運用一些小技巧來減少出錯的概率:如先定義少許的主機、服務,待校驗無誤后再追加。
三、驗收
用瀏覽器輸入nagios所在服務器的ip及目錄,如http://61.135.X..X/nagios,再輸驗證所需的用戶名和密碼,就可點擊頁面右邊的相關連接來查看各種狀態。關掉某個被nagios監控主機的服務或者拔掉某個服務器的網線,等幾分鐘,點擊超連接“Service Detail”觀察頁面狀態看是否有紅色的醒目的報警出現。
一會兒,就會收到報警短信和報警郵件,然后在把測試所有的服務開啟或把拔下來的網線查上去,片刻后,網頁里的紅色報警表格消失,手機短信或郵件通知故障恢復。如果你的情況也這樣,那么真正大功告成。
Nagios的功能十分強大,在我的項目里,因為我的需求不同而盡可能的簡化了nagios而沒有使用代理、更多插件等功能,在一個不超過1000個服務器的網絡規模里,它工作得很好。如果有更多的服務器,建議使用mysql數據來管理監控對象。在部署nagios的過程中,我啊、做很多選項作了取舍,更詳細的情況請參照官方的文檔。
文章來源于領測軟件測試網 http://www.kjueaiud.com/