同一場景
1.小用戶量的情況下測試
2.大用戶量情況下的測試
分析的方法:
整個系統架構分析,系統響應時間消耗,利用圖表分析
查看事務響應時間,通過事務摘要圖分析事務響應時間,那個消耗最大(通過小用戶量和大用戶量的響應時間分析,查看那個事務響應時間最高),確定哪部分功能是性能的瓶頸,分析window resource圖表,查看cpu
使用下列計數器標識cpu瓶頸
Processor\ Interrupts/sec
Processor\ % Processor Time
Process(process)\ % Processor Time
System\ Processor Queue Length
通過它來確定是否硬件本身出現瓶頸,或者進一步確定應該怎么去判斷性能產生瓶頸的地方!
下一步去判斷進程,那個進程消耗cpu最高
下邊就有很多種情況需要你自己去判斷,有可能是進程調用了的函數消耗了系統資源形成上邊的問題,也有可能是后臺數據庫出現的問題(這個就要看你的系統配置是什么樣的,比如你的db服務器和應用服務器都配置在一臺機器上)
性能產生瓶頸有很多地方,所以需要進一判斷,是否是后臺數據庫的問題還有待分析,是那條語句導致的問題需要進一步分析判斷。
分析原則:
? 具體問題具體分析(這是由于不同的應用系統,不同的測試目的,不同的性能關注點)
? 查找瓶頸時按以下順序,由易到難。
服務器硬件瓶頸-〉網絡瓶頸(對局域網,可以不考慮)-〉服務器操作系統瓶頸(參數配置)-〉中間件瓶頸(參數配置,數據庫,web服務器等)-〉應用瓶頸(SQL語句、數據庫設計、業務邏輯、算法等)
注:以上過程并不是每個分析中都需要的,要根據測試目的和要求來確定分析的深度。對一些要求低的,我們分析到應用系統在將來大的負載壓力(并發用戶數、數據量)下,系統的硬件瓶頸在哪兒就夠了。
? 分段排除法 很有效
分析的信息來源:
?1 根據場景運行過程中的錯誤提示信息
?2 根據測試結果收集到的監控指標數據
一.錯誤提示分析
分析實例:
1 ?Error: Failed to connect to server "10.10.10.30:8080": [10060] Connection
?Error: timed out Error: Server "10.10.10.30" has shut down the connection prematurely
分析:
?A、應用服務死掉。
(小用戶時:程序上的問題。程序上處理數據庫的問題)
?B、應用服務沒有死
(應用服務參數設置問題)
例:在許多客戶端連接Weblogic應用服務器被拒絕,而在服務器端沒有錯誤顯示,則有可能是Weblogic中的server元素的Aclearcase/" target="_blank" >cceptBacklog屬性值設得過低。如果連接時收到connection refused消息,說明應提高該值,每次增加25%
?C、數據庫的連接
(1、在應用服務的性能參數可能太小了 2、數據庫啟動的最大連接數(跟硬件的內存有關))
2 Error: Page download timeout (120 seconds) has expired
分析:可能是以下原因造成
?A、應用服務參數設置太大導致服務器的瓶頸
?B、頁面中圖片太多
?C、在程序處理表的時候檢查字段太大多
二.監控指標數據分析
1.最大并發用戶數:
應用系統在當前環境(硬件環境、網絡環境、軟件環境(參數配置))下能承受的最大并發用戶數。
在方案運行中,如果出現了大于3個用戶的業務操作失敗,或出現了服務器shutestdirector/" target="_blank" >tdown的情況,則說明在當前環境下,系統承受不了當前并發用戶的負載壓力,那么最大并發用戶數就是前一個沒有出現這種現象的并發用戶數。
如果測得的最大并發用戶數到達了性能要求,且各服務器資源情況良好,業務操作響應時間也達到了用戶要求,那么OK。否則,再根據各服務器的資源情況和業務操作響應時間進一步分析原因所在。
2.業務操作響應時間:
? 分析方案運行情況應從平均事務響應時間圖和事務性能摘要圖開始。使用“事務性能摘要”圖,可以確定在方案執行期間響應時間過長的事務。
? 細分事務并分析每個頁面組件的性能。查看過長的事務響應時間是由哪些頁面組件引起的?問題是否與網絡或服務器有關?
? 如果服務器耗時過長,請使用相應的服務器圖確定有問題的服務器度量并查明服務器性能下降的原因。如果網絡耗時過長,請使用“網絡監視器”圖確定導致性能瓶頸的網絡問題
3.服務器資源監控指標:
內存:
1 UNIX資源監控中指標內存頁交換速率(Paging rate),如果該值偶爾走高,表明當時有線程競爭內存。如果持續很高,則內存可能是瓶頸。也可能是內存訪問命中率低。
2Windows資源監控中,如果Process\Private Bytes計數器和Process\Working Set計數器的值在長時間內持續升高,同時Memory\Available bytes計數器的值持續降低,則很可能存在內存泄漏。
內存資源成為系統性能的瓶頸的征兆:
很高的換頁率(high pageout rate);
進程進入不活動狀態;
交換區所有磁盤的活動次數可高;
可高的全局系統CPU利用率;
內存不夠出錯(out of memory errors)
處理器:
1 UNIX資源監控(Windows操作系統同理)中指標CPU占用率(CPU utilization),如果該值持續超過95%,表明瓶頸是CPU??梢钥紤]增加一個處理器或換一個更快的處理器。如果服務器專用于SQL Server,可接受的最大上限是80-85%
合理使用的范圍在60%至70%。
2 Windows資源監控中,如果System\Processor Queue Length大于2,而處理器利用率(Processor Time)一直很低,則存在著處理器阻塞。
CPU資源成為系統性能的瓶頸的征兆:
很慢的響應時間(slow response time)