搜索
写经验 领红包
 > 育儿

系统性能分析工具(系统性能分析要写什么内容)

导语:系统性能分析工具:perf

perf 是Linux的一款性能分析工具,能够进行函数级和指令级的热点查找,可以用来分析程序中热点函数的CPU占用率,从而定位性能瓶颈。

perf:Performance analysis tools for Linux.

系统性能优化通常可以分为两个阶段:性能分析和性能优化。

性能分析的目的是查找性能瓶颈、热点代码,分析引发性能问题的原因;基于性能分析,可以进行性能优化,包括:算法优化(空间复杂度和时间复杂度的权衡)和代码优化(提高执行速度、减少内存占用)。1、perf 的原理

Linux性能计数器是一个基于内核的子系统,它提供一个性能分析框架,比如硬件(CPU、PMU(Performance Monitoring Unit))功能和软件(软件计数器、tracepoint)功能。

通过 perf,应用程序可以利用PMU、tracepoint和内核中的计数器来进行性能统计。

Perf 可以对程序进行函数级别的采样,从而了解程序的性能瓶颈在哪里。其基本原理是:每隔一个固定时间,就是CPU上产生一个中断,看当前是哪个进程、哪个函数,然后给对应的进程和函数加一个统计值,这样就知道CPU有多少时间在某个进程或某个函数上了。

2、perf 的安装

在终端输入下面命令即可:

sudo apt install linux-tools-common linux-tools-generic linux-tools-`uname -r`
3、top 的使用

top 命令也是Linux下的性能分析工具,能够实时显示系统中各个进程的资源占用状况。

使用 perf 之前,可以先用 top 命令查看指定进程(xxx)的CPU占用率是否异常,命令如下:

top -p `ps aux | grep &34; | grep -v grep | cut -c 9-15` -d 1 -b

上面命令的含义是通过 top 查看指定进程(xxx)的整体运行情况,其中,

top -p:指定进程top -d 1:指定屏幕刷新时间,1s刷新一次top -b:表示以批处理模式操作ps aux:列出所有进程grep:查找指定进程grep -v:反向查找cut -c 9-15:选择每行指定列的字符

4、perf 的使用

使用 perf 进行性能分析,主要使用下面两个命令:

perf record:保存perf追踪的内容,文件名为perf.dataperf report:解析perf.data的内容

比如要分析进程 xxx,启动该进程后,首先启动使用下面命令:

sudo perf record -a --call-graph dwarf -p `ps aux | grep &34; | grep -v grep | cut -c 9-15`

其中,

-a:表示对所有CPU采样--call-graph dward:表示分析调用栈的关系-p:表示分析指定的进程

通过 Ctrl + C 结束后,会生成 perf.data 文件,然后通过 report 导出报告,即可以查看 main 函数和子函数的CPU平均占用率。

sudo perf report -i perf.data > perf.txt
5、perf 使用示例

比如,有下面一段代码。

include <cmath>using namespace std;void for_loop(){    for (int i = 0; i < 1000; i++) {        for (int j = 0; j < 10000; j++) {            int x = sin(i) + cos(j);        }    }}void loop_small(){    for (int i = 0; i < 10; i++) {        for_loop();    }}void loop_big(){    for (int i = 0; i < 100; i++) {        for_loop();    }}int main(){    loop_big();    loop_small();    return 0;}

其中,

for_loop()是一个两层循环,每次都要计算正弦和余弦的和,这是一个比较耗时的函数;loop_small()把for_loop()循环10次;loop_big()把for_loop()循环100次。

可以明显看出 main() 函数中 loop_big() 函数会占大部分CPU,下面通过 perf 命令验证下。

1)假设指定可执行文件的名称为“perf_for”,

g++ perf_for.cpp -o perf_for

2)运行 perf_for 之后,启动 perf record:

sudo perf record -a --call-graph dwarf -p `ps aux | grep &34; | grep -v grep | cut -c 9-15` -d 1 -b

3)结束后,通过 perf report 导出报告:

sudo perf report -i perf.data > perf.txt

如下图所示,可以看出main函数90%的CPU都花在 loop_big() 函数上。

优化时就可以考虑:

首先考虑优化 for_loop() 函数,主要是 sin 和 cos 的计算;若 for_loop() 函数无法优化,就考虑优化 loop_big(),比如减少 for_loop() 函数的调用次数。

本文内容由小美整理编辑!