perf usecase.md - openthos/openthos GitHub Wiki

perf分析的前提

以某应用性能分析为例

观察之前, 应该先回答以下问题:

按 tracepoint, 抓 sched:sched_switch 和 raw_syscalls, 分析调度轨迹, 看看程序是否串行部分过多, 没有达到题主期望的并行度. 这方面可以借助图形化工具 TraceCompass, 不过用起来确实比较复杂. 基本的顺序是:

# perf record -a -e sched:sched_switch -e raw_syscalls:* --exclude-perf ...
# perf data convert --to-ctf ./out.ctf

将 out.ctf 导入 TraceCompass 工具也可以在 convert 成 CTF 后借助 libbabeltrace 用 python 脚本分析. 简单的话也可以手工分析.

# perf record -a -e syscalls:sys_enter_futex -e syscalls:sys_exit_futex ...

开销也许会小一些.

# perf probe /a/b/c.so func
# perf probe /a/b/c.so func%return

然后抓这两个点, 用 perf script 观察函数进入和退出的时间.

#　perf stat -e {cycles,instructions} ...

然后计算一下 IPC, 看看指令执行的快还是慢. 有 TopDown 模型能够将这些计数器翻译成更容易理解的数据. 不过只有 vTune 知道这些细节.

系统级的性能分析可以关注一下 Brendan Gregg 的 blog.