sar 找出系统瓶颈的利器

sar是System Activity Reporter(系统活动情况报告)的缩写。sar工具将对系统当前的状态进行取样,然后通过计算数据和比例来表达系统的当前运行状态。它的特点是可以连续对系统取样,获得大量的取样数据;取样数据和分析的结果都可以存入文件,所需的负载很小。sar是目前Linux上最为全面的系统性能分析工具之一,可以从14个大方面对系统的活动进行报告,包括文件的读写情况、系统调用的使用情况、串口、CPU效率、内存使用状况、进程活动及IPC有关的活动等,使用也是较为复杂。

原文链接:
sar 找出系统瓶颈的利器
sar是查看操作系统报告指标的各种工具中,最为普遍和方便的;它有两种用法;

  1. 追溯过去的统计数据(默认)
  2. 周期性的查看当前数据

➡️查看CPU使用率

sar -u 默认情况下显示的cpu使用率等信息就是sar -u;

1
2
3
4
5
6
7
8
9
10
11
12
13
[root@lilis ~]# sar -u
Linux 3.10.0-862.9.1.el7.x86_64 (lilis) 08/23/2018 _x86_64_ (1 CPU)

12:00:01 AM CPU %user %nice %system %iowait %steal %idle
12:10:01 AM all 0.85 0.00 0.29 0.04 0.00 98.83
12:20:01 AM all 1.63 0.00 0.34 0.07 0.00 97.96
12:30:01 AM all 0.73 0.00 0.25 0.04 0.00 98.98
12:40:01 AM all 0.28 0.00 0.25 0.01 0.00 99.46
12:50:01 AM all 0.31 0.00 0.26 0.01 0.00 99.43
01:00:01 AM all 1.63 0.00 0.34 0.10 0.00 97.94
01:10:01 AM all 0.66 0.00 0.29 0.03 0.00 99.02
01:20:01 AM all 1.27 0.00 0.30 0.06 0.00 98.37
01:30:01 AM all 0.29 0.00 0.27 0.01 0.00 99.44
  • %user 用户模式下消耗的CPU时间的比例;
  • %nice 通过nice改变了进程调度优先级的进程,在用户模式下消耗的CPU时间的比例
  • %system 系统模式下消耗的CPU时间的比例;
  • %iowait CPU等待磁盘I/O导致空闲状态消耗的时间比例;
  • %steal 利用Xen等操作系统虚拟化技术,等待其它虚拟CPU计算占用的时间比例;
  • %idle CPU空闲时间比例;

➡️查看平均负载

sar -q 查看平均负载
指定-q后,就能查看运行队列中的进程数、系统上的进程大小、平均负载等;与其它命令相比,它能查看各项指标随时间变化的情况;

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
[root@lilis ~]# sar -q
Linux 3.10.0-862.9.1.el7.x86_64 (lilis) 08/23/2018 _x86_64_ (1 CPU)

12:00:01 AM runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
12:10:01 AM 3 187 0.00 0.02 0.05 0
12:20:01 AM 4 190 0.06 0.03 0.05 0
12:30:01 AM 4 187 0.00 0.01 0.05 1
12:40:01 AM 3 187 0.00 0.01 0.05 0
12:50:01 AM 3 187 0.07 0.10 0.08 1
01:00:01 AM 2 190 0.24 0.08 0.06 0
01:10:01 AM 2 187 0.08 0.03 0.05 0
01:20:01 AM 1 187 0.00 0.03 0.05 1
01:30:01 AM 3 187 0.00 0.01 0.05 0
01:40:01 AM 2 187 0.01 0.03 0.05 1
01:50:01 AM 3 187 0.00 0.01 0.05 1
02:00:01 AM 2 187 0.00 0.01 0.05 0
02:10:01 AM 3 190 0.00 0.04 0.05 0
  • runq-sz:运行队列的长度(等待运行的进程数)
  • plist-sz:进程列表中进程(processes)和线程(threads)的数量
  • ldavg-1:最后1分钟的系统平均负载 ldavg-5:过去5分钟的系统平均负载
  • ldavg-15:过去15分钟的系统平均负载

➡️查看页面交换发生状况

sar -W 查看页面交换发生状况
页面发生交换时,服务器的吞吐量会大幅下降;服务器状况不良时,如果怀疑因为内存不足而导致了页面交换的发生,可以使用这个命令来确认是否发生了大量的交换;

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
[root@lilis ~]# sar -W 1 10
Linux 3.10.0-862.9.1.el7.x86_64 (lilis) 08/23/2018 _x86_64_ (1 CPU)

11:43:35 AM pswpin/s pswpout/s
11:43:36 AM 0.00 0.00
11:43:37 AM 0.00 0.00
11:43:38 AM 0.00 0.00
11:43:39 AM 0.00 0.00
11:43:40 AM 0.00 0.00
11:43:41 AM 0.00 0.00
11:43:42 AM 0.00 0.00
11:43:43 AM 0.00 0.00
11:43:44 AM 0.00 0.00
11:43:45 AM 0.00 0.00
Average: 0.00 0.00
  • pswpin/s:每秒系统换入的交换页面(swap page)数量

  • pswpout/s:每秒系统换出的交换页面(swap page)数量
    要判断系统瓶颈问题,有时需几个 sar 命令选项结合起来;

  • 怀疑CPU存在瓶颈,可用 sar -u 和 sar -q 等来查看

  • 怀疑内存存在瓶颈,可用sar -B、sar -r 和 sar -W 等来查看

  • 怀疑I/O存在瓶颈,可用 sar -b、sar -u 和 sar -d 等来查看

➡️安装

有的linux系统下,默认可能没有安装这个包,使用yum install sysstat 来安装;
安装完毕,将性能收集工具的开关打开: vim /etc/default/sysstat
设置 ENABLED=”true”

➡️sar参数说明

  • -A 汇总所有的报告
  • -a 报告文件读写使用情况
  • -B 报告附加的缓存的使用情况
  • -b 报告缓存的使用情况
  • -c 报告系统调用的使用情况
  • -d 报告磁盘的使用情况
  • -g 报告串口的使用情况
  • -h 报告关于buffer使用的统计数据
  • -m 报告IPC消息队列和信号量的使用情况
  • -n 报告命名cache的使用情况
  • -p 报告调页活动的使用情况
  • -q 报告运行队列和交换队列的平均长度
  • -R 报告进程的活动情况
  • -r 报告没有使用的内存页面和硬盘块
  • -u 报告CPU的利用率
  • -v 报告进程、i节点、文件和锁表状态
  • -w 报告系统交换活动状况
  • -y 报告TTY设备活动状况