數據收集前的準備工作:如果近期有頻繁出現服務器死機或者服務掛起現象,建議首先做下面三步準備工作.
1. 修改Notes.ini文件。建議在Domino服務器的notes.ini文件中增加以下參數:
DEBUG_CAPTURE_TIMEOUT=1
DEBUG_SHOW_TIMEOUT=1
DEBUG_THREADID=1
DEBUG_OUTFILE=debug.txt
注: 建議在問題解決后,刪除前三個參數.
2. 添加一個新的New Server Statistic Collection的記錄來記錄服務器的統計信息。
A. 在Domino Administrator中,點 配置 ---> Statistics & Events ---> Server Statistic Collection, 點New Server Statistic Collection,如下圖所示:
B. 參照下圖做相應設置:
C. 保存退出。
D. 在服務器停止運行狀態下,修改notes.ini文件中,查找名為 ServerTasks 的行,并在行最后加入 ",collect"
E. 重啟Domino服務器
3. 安裝memcheck (此工具在Domino 5.0.8以前的版本需要單獨安裝,5.0.9版本之后,服務器安裝后就已經自動包含,所以可以忽略此步驟)
A. 首先從Lotus技術支持人員處,獲得特定平臺上的特定版本使用的Memcheck。
B. 必須把獲得的memcheck文件(文件名有可能是memcheck508等)重命名為memcheck,不帶有任何平臺及版本信息,例如
> mv memcheck5.07 memcheck
C. 拷貝此文件到Domino的程序目錄下,例如對于Domino/Solaris, 程序目錄是 /opt/lotus/notes/latest/sunspa
D. 改變文件的Ownership,例如:> chown root:bin memcheck
E. 修改文件的權限,例如: > chmod 755 memcheck
F. 切換至操作系統的notes用戶,在Domino數據目錄下運行命令:> nsd ,如果出現下面類似信息,則說明memcheck安裝已經成功。如果沒有成功,請根據出錯信息,檢查相應設置。
Debugger Version: Standard
MEMCHECK Version: MEMCHECK Version (X.X) for Lotus Notes Release 5.0.2b (<date of run>)
當出現服務器掛起(hang)問題時,收集下面數據:
1.以”notes”用戶在DOMINO數據目錄下運行”nsd”,產生log文件。文件格式類似于:
nsd_all_AIX_lotus_11_01@20_43.log
2.從Notes客戶端訪問服務器,記錄錯誤信息。
3.在客戶端運行“NPING”工具訪問Domino服務器,記錄響應時間,收集數據。
注 : nping的應用程序需要另行安裝, 請訪問下面的網址:
4.在客戶端“PING”服務器地址,記錄響應時間,收集數據。
5.在控制臺運行”sh task debug”,”sh user debug”,”sh port tcpip”,”sh stat ”等命令查看服務器運行狀態,收集相關數據。
6.在服務器上運行.netstat -a”,“vmstat 2”30秒后結束,“iostat 2”30秒后結束,收集所有三條命令產生的數據。
7.在距第一次收集 nsd 文件5-10分鐘后,以”notes”用戶在DOMINO數據目錄下再次運行nsd命令,產生log文件。
8. 在Domino數據目錄下查找是否有名為“core.xxxxx.xxx_xxxx_xx_xx@xx_xx.Z”格式的文件,如果有,將其收集起來。
9. 在Domino數據目錄或者程序目錄下搜索,是否有名為SEMDEBUG.TXT的文件,如果有將其收集起來,并將原文件刪除。
10. 重啟服務器.
11. 在以上步驟完成后,將上面九步收集的所有數據,外加debug.txt;statrep.nsf;log.nsf;一起發送給Lotus技術支持人員。
當出現服務器死機(crash)問題時,收集以下數據:
1. 以”notes”用戶在DOMINO數據目錄下運行”nsd”,產生log文件.文件格式類似于:
nsd_all_AIX_lotus_11_01@20_43.log
2. 在客戶端“PING”服務器地址,記錄響應時間,收集數據。
3. 在距第一次收集 nsd 文件5-10分鐘后,以”notes”用戶在DOMINO數據目錄下再次運行nsd命令,產生log文件。
4. 在Domino數據目錄下查找是否有名為“core.xxxxx.xxx_xxxx_xx_xx@xx_xx.Z”格式的文件,如果有,將其收集起來。
5. 在Domino數據目錄或者程序目錄下搜索,是否有名為SEMDEBUG.TXT的文件,如果有將其收集起來,并將原文件刪除。
6. 重啟服務器.
7. 在以上步驟完成后,將上面六步收集的所有數據,外加debug.txt;statrep.nsf;log.nsf;一起發送給Lotus技術支持人員。