佳木斯湛栽影视文化发展公司

主頁 > 知識(shí)庫 > Tomcat進(jìn)程占用CPU過高的解決方法

Tomcat進(jìn)程占用CPU過高的解決方法

熱門標(biāo)簽:智能手機(jī) 使用U盤裝系統(tǒng) 阿里云 網(wǎng)站建設(shè) 美圖手機(jī) 硅谷的囚徒呼叫中心 百度競價(jià)點(diǎn)擊價(jià)格的計(jì)算公式 檢查注冊(cè)表項(xiàng)

CPU經(jīng)常會(huì)成為系統(tǒng)性能的瓶頸,可能:

  • 內(nèi)存泄露導(dǎo)致頻繁GC,進(jìn)而引起CPU使用率過高
  • 代碼Bug創(chuàng)建了大量的線程,導(dǎo)致CPU頻繁上下文切換

通常所說的CPU使用率過高,隱含著一個(gè)用來比較高與低的基準(zhǔn)值,比如

  • JVM在峰值負(fù)載下的平均CPU利用率40%
  • CPU使用率飆到80%就可認(rèn)為不正常

JVM進(jìn)程包含多個(gè)Java線程:

  • 一些在等待工作
  • 另一些則正在執(zhí)行任務(wù)

最重要的是找到哪些線程在消耗CPU,通過線程棧定位到問題代碼
如果沒有找到個(gè)別線程的CPU使用率特別高,考慮是否線程上下文切換導(dǎo)致了CPU使用率過高。

案例

程序模擬CPU使用率過高 - 在線程池中創(chuàng)建4096個(gè)線程

在Linux環(huán)境下啟動(dòng)程序:

java -Xss256k -jar demo-0.0.1-SNAPSHOT.jar

線程棧大小指定為256KB。對(duì)于測試程序來說,操作系統(tǒng)默認(rèn)值8192KB過大,因?yàn)樾枰獎(jiǎng)?chuàng)建4096個(gè)線程。

使用top命令,我們看到Java進(jìn)程的CPU使用率達(dá)到了961.6%,注意到進(jìn)程ID是55790。

用更精細(xì)化的top命令查看這個(gè)Java進(jìn)程中各線程使用CPU的情況:

#top -H -p 55790

可見,有個(gè)叫“scheduling-1”的線程占用了較多的CPU,達(dá)到了42.5%。因此下一步我們要找出這個(gè)線程在做什么事情。

為了找出線程在做什么,用jstack生成線程快照。
jstack輸出較大,一般將其寫入文件:

jstack 55790 > 55790.log

打開55790.log,定位到第4步中找到的名為 scheduling-1 的線程,其線程棧:

看到AbstractExecutorService#submit這個(gè)函數(shù)調(diào)用,說明它是Spring Boot啟動(dòng)的周期性任務(wù)線程,向線程池中提交任務(wù),該線程消耗了大量CPU。

上下文切換開銷?

經(jīng)歷上述過程,往往已經(jīng)可以定位到大量消耗CPU的線程及bug代碼,比如死循環(huán)。但對(duì)于該案例:Java進(jìn)程占用的CPU是961.6%, 而“scheduling-1”線程只占用了42.5%的CPU,那其它CPU被誰占用了?

第4步用top -H -p pid命令看到的線程列表中還有許多名為“pool-1-thread-x”的線程,它們單個(gè)的CPU使用率不高,但是似乎數(shù)量比較多。你可能已經(jīng)猜到,這些就是線程池中干活的線程。那剩下的CPU是不是被這些線程消耗了呢?

還需要看jstack的輸出結(jié)果,主要是看這些線程池中的線程是不是真的在干活,還是在“休息”呢?

發(fā)現(xiàn)這些“pool-1-thread-x”線程基本都處WAITING狀態(tài)。

  • Blocking指的是一個(gè)線程因?yàn)榈却R界區(qū)的鎖(Lock或者synchronized關(guān)鍵字)而被阻塞的狀態(tài),請(qǐng)你注意的是處于這個(gè)狀態(tài)的線程還沒有拿到鎖
  • Waiting指的是一個(gè)線程拿到了鎖,但需等待其他線程執(zhí)行某些操作。比如調(diào)用了Object.wait、Thread.join或LockSupport.park方法時(shí),進(jìn)入Waiting狀態(tài)。前提是這個(gè)線程已經(jīng)拿到鎖了,并且在進(jìn)入Waiting狀態(tài)前,os層面會(huì)自動(dòng)釋放鎖,當(dāng)?shù)却龡l件滿足,外部調(diào)用了Object.notify或者LockSupport.unpark方法,線程會(huì)重新競爭鎖,成功獲得鎖后才能進(jìn)入到Runnable狀態(tài)繼續(xù)執(zhí)行。

回到我們的“pool-1-thread-x”線程,這些線程都處在“Waiting”狀態(tài),從線程棧我們看到,這些線程“等待”在getTask方法調(diào)用上,線程嘗試從線程池的隊(duì)列中取任務(wù),但是隊(duì)列為空,所以通過LockSupport.park調(diào)用進(jìn)到了“Waiting”狀態(tài)。那“pool-1-thread-x”線程有多少個(gè)呢?通過下面這個(gè)命令來統(tǒng)計(jì)一下,結(jié)果是4096,正好跟線程池中的線程數(shù)相等。

grep -o 'pool-2-thread' 55790.log | wc -l

剩下CPU到底被誰消耗了?
應(yīng)該懷疑CPU的上下文切換開銷了,因?yàn)槲覀兛吹絁ava進(jìn)程中的線程數(shù)比較多。

下面通過vmstat命令來查看一下操作系統(tǒng)層面的線程上下文切換活動(dòng):

cs那一欄表示線程上下文切換次數(shù),in表示CPU中斷次數(shù),我們發(fā)現(xiàn)這兩個(gè)數(shù)字非常高,基本證實(shí)了我們的猜測,線程上下文切切換消耗了大量CPU。
那具體是哪個(gè)進(jìn)程導(dǎo)致的呢?

停止Spring Boot程序,再次運(yùn)行vmstat命令,會(huì)看到in和cs都大幅下降,這就證實(shí)引起線程上下文切換開銷的Java進(jìn)程正是55790。

總結(jié)

遇到CPU過高,首先定位哪個(gè)進(jìn)程導(dǎo)致的,之后可以通過top -H -p pid命令定位到具體的線程。
其次還要通jstack查看線程的狀態(tài),看看線程的個(gè)數(shù)或者線程的狀態(tài),如果線程數(shù)過多,可以懷疑是線程上下文切換的開銷,我們可以通過vmstat和pidstat這兩個(gè)工具進(jìn)行確認(rèn)。

到此這篇關(guān)于Tomcat進(jìn)程占用CPU過高的解決方法的文章就介紹到這了,更多相關(guān)Tomcat進(jìn)程占用CPU過高內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

標(biāo)簽:懷化 煙臺(tái) 山南 湖北 通遼 黃山 湘潭 賀州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Tomcat進(jìn)程占用CPU過高的解決方法》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    宜君县| 杂多县| 吐鲁番市| 北流市| 镇安县| 西林县| 太康县| 古蔺县| 鄢陵县| 邢台市| 余干县| 基隆市| 梅州市| 安西县| 凤凰县| 苏尼特左旗| 满城县| 普陀区| 永德县| 正定县| 信丰县| 增城市| 桂平市| 仁化县| 惠水县| 青海省| 淳化县| 丹棱县| 碌曲县| 四会市| 德钦县| 陆河县| 万年县| 武强县| 简阳市| 龙井市| 廊坊市| 安陆市| 弥渡县| 武安市| 娄烦县|