主题
CPU负载与CPU使用率之区别
简介
存储、内存和 CPU(中央处理器)等系统资源不足会极大地影响应用程序的性能。因此,监控这些组件至关重要。
与磁盘和内存不同,监控 Linux 系统上的 CPU 使用率并不那么简单。在本文中,我们将了解如何解释 CPU 指标并以人类可读的格式显示它们。
CPU 负载与 CPU 使用率
尽管 CPU 负载和 CPU 使用率听起来很相似,但它们是不可互换的。CPU 负载定义为在单个时间点使用或等待使用一个内核的进程数。 假设我们有一个单核系统,我们的 CPU 平均负载始终低于 0.6。这表明每个需要使用 CPU 的进程都可以立即使用它,而无需等待。如果 CPU 平均负载大于 1,则表示有进程需要使用 CPU,但由于 CPU 不可用,目前无法使用。
但是,多处理器系统中高于 1 的平均负载不会成为问题,因为有更多内核可用。
uptime命令为我们提供了以 1、5 和 15 分钟为间隔的平均负载视图:
sh
# uptime
[root@VM-0-2-opencloudos ~]# uptime
18:12:58 up 141 days, 18:56, 2 users, load average: 0.01, 0.06, 0.07
如果不知道系统的核心数,就无法解释平均负载:
sh
# cat /proc/cpuinfo |grep core
[root@VM-0-2-opencloudos ~]# cat /proc/cpuinfo |grep core
core id : 0
cpu cores : 2
core id : 1
cpu cores : 2
另一方面,CPU 使用率是 CPU 处理非空闲任务所花费的时间百分比。CPU 使用率只能在指定的时间间隔内测量。我们可以通过将空闲时间的百分比从 100 中减去来确定 CPU 使用率。
计算CPU使用率
使用vmstat获取 CPU 使用率
vmstat命令近乎实时地显示 CPU 活动:
sh
# vmstat 3 4
[root@VM-0-2-opencloudos ~]# vmstat 3 4
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 77368 141560 89356 2654280 0 0 1 40 0 1 2 1 96 0 0
0 0 77368 141044 89356 2654356 0 0 0 187 4410 8410 5 4 91 0 0
0 0 77368 141228 89356 2654384 0 0 0 43 4067 7931 5 3 92 0 0
0 0 77368 140368 89356 2654428 0 0 0 29 4160 8146 5 4 91 0 0
CPU 下的列提供了处理器时间花费在哪里的概览:
us –运行非内核代码所花费的时间 sy -运行内核代码所花费的时间 id –空闲时间 wa –等待 I/O 所花费的时间 st -从虚拟机中窃取时间 id列是我们感兴趣的。延迟一秒,我们使用 vmstat 计算CPU使用率:
sh
[root@VM-0-2-opencloudos ~]# echo "CPU Usage: "$[100-$(vmstat 1 2|tail -1|awk '{print $15}')]"%"
CPU Usage: 12%
没有提供任何参数的vmstat命令将给出自引导以来的 CPU 时间。这不会提供准确的 CPU 使用百分比。因此,参数只能是 1 和 2,我们采用一秒钟后计算的指标:
sh
# vmstat 1 2
[root@VM-0-2-opencloudos ~]# vmstat 1 2
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 77368 139888 89484 2655156 0 0 1 40 0 1 2 1 96 0 0
0 0 77368 140492 89484 2655148 0 0 0 372 3740 7361 3 3 95 0 0
使用/proc/stat获取 CPU 使用率
CPU 活动也可以从/proc/stat文件中提取。该文件包含自启动以来有关系统的各种指标:
sh
#cat /proc/stat
[root@VM-0-2-opencloudos ~]# cat /proc/stat
cpu 53616436 96925 32792560 2335548788 1264458 0 407328 0 0 0
cpu0 26810460 50389 16366275 1167679260 419652 0 181661 0 0 0
cpu1 26805975 46536 16426285 1167869528 844806 0 225666 0 0 0
intr 8118153395 107 9 0 0 452 0 3 0 0 0 0 0 15 0 11964001 0 0 0 0 0 0 0 0 0 0 65953801 5 51413844 1 50905358 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
ctxt 82008368103
btime 1721315788
processes 158266690
procs_running 4
procs_blocked 0
softirq 7566251289 1 3090751131 220 243224191 70021177 0 22924 1746713157 57374 2415461114
第一行, 'cpu' 是系统所有核心指标的聚合。在具有 4 个内核的系统上,将有 4条cpu线——cpu0、cpu1、cpu2和cpu3。' cpu ' 行中的列表示处理不同任务所花费的时间:
- user – 在用户模式下花费的时间
- nice – 在用户模式下处理 nice 进程所花费的时间
- system – 执行内核代码所花费的时间
- idle - 空闲时间
- iowait – 等待 I/O 所花费的时间
- irq - 服务中断所花费的时间
- softirq – 服务软件中断所花费的时间
- steal —从虚拟机中窃取的时间
- guest - 为来宾操作系统运行虚拟 CPU 所花费的时间
- guest_nice – 为“不错的”客户操作系统运行虚拟 CPU 所花费的时间
我们将使用这些指标来计算平均空闲百分比。随后,我们将使用计算值来计算 CPU 使用率。需要注意的是,较旧的 Linux 发行版不计算窃取、来宾或来宾_nice指标。如果我们使用的是旧系统,我们会在计算中忽略这些指标:
sh
平均空闲时间 (%) = (idle * 100) / (user + nice + system + idle + iowait + irq + softirq +steal + guest + guest_nice)
[root@VM-0-2-opencloudos ~]# cat /proc/stat |grep cpu |tail -1|awk '{print ($5*100)/($2+$3+$4+$5+$6+$7+$8+$9+$10)}'|awk '{print "CPU Usage: " 100-$1}'
CPU Usage: 3.6585
由于我们正在开发单核系统,因此“cpu”行将与“cpu1 ”相同。因此,tail -1 的使用是 只检索其中一行。然而,我们会在多处理器系统上使用“ cpu ”行,因为它是所有内核上的指标的集合。
使用top获取 CPU 使用率
通常,top命令通常用于显示系统上的活动进程以及这些进程消耗了多少资源。不过,我们可以使用这个命令来测量 CPU 的状态:
sh
# top
[root@VM-0-2-opencloudos ~]# top
top - 18:16:39 up 141 days, 19:00, 2 users, load average: 0.35, 0.16, 0.11
Tasks: 156 total, 1 running, 155 sleeping, 0 stopped, 0 zombie
%Cpu(s): 6.4 us, 5.1 sy, 0.0 ni, 88.3 id, 0.2 wa, 0.0 hi, 0.0 si, 0.0 st
MiB Mem : 7696.2 total, 135.6 free, 4879.4 used, 2681.3 buff/cache
MiB Swap: 4096.0 total, 4020.4 free, 75.6 used. 2087.8 avail Mem
-n选项是top命令在结束前应该使用的迭代次数。我们避免使用第一个循环,因为我们检索的指标将是自启动以来的值。因此,我们进行了第二次迭代。
或者,在多处理器系统中,我们必须将给定的“ id”值除以内核数,然后从 100 中减去该值。例如,如果我们在四核系统上运行,并且“ id ”值为 304%,我们将 CPU 使用率计算为:
sh
CPU 使用率 % = 100 – (304/4)
[root@VM-0-2-opencloudos ~]# top -bn2 | grep '%Cpu' | tail -1 | grep -P '(....|...) id,'|awk '{print "CPU Usage: " 100-($8/4) "%"}'
CPU Usage: 77.625%