rtla-hwnoise¶
检测和量化硬件相关噪声¶
- 手册章节:
1
概要¶
rtla hwnoise [选项]
描述¶
rtla hwnoise 从禁用中断的 osnoise 跟踪器收集定期摘要。通过禁用中断,以及随之而来的线程调度,只允许不可屏蔽中断和硬件相关噪声。
该工具还允许配置 osnoise 跟踪器和收集跟踪器输出。
选项¶
-a, --auto us
设置自动跟踪模式。此模式在调试系统时设置一些常用选项。它等效于使用 -s us -T 1 -t。
-p, --period us
设置 osnoise 跟踪器的周期,单位为微秒。
-r, --runtime us
设置 osnoise 跟踪器的运行时间,单位为微秒。
-s, --stop us
如果单个样本高于参数(单位为微秒),则停止跟踪。如果设置了 -T,它还会将跟踪保存到输出。
-S, --stop-total us
如果总样本高于参数(单位为微秒),则停止跟踪。如果设置了 -T,它还会将跟踪保存到输出。
-T, --threshold us
指定两个时间读取之间被视为噪声的最小差值。默认阈值为 5 us。
-t, --trace [文件]
将停止的跟踪保存到 [文件|osnoise_trace.txt]。
-q, --quiet
仅在会话结束时打印摘要。
-c, --cpus cpu-list
设置 osnoise 跟踪器以在 cpu-list 中运行采样线程。
-H, --house-keeping cpu-list
仅在给定的 cpu-list 上运行 rtla 控制线程。
-d, --duration 时间[s|m|h|d]
设置会话的持续时间。
-D, --debug
打印调试信息。
-e, --event sys:事件
在跟踪 (-t) 会话中启用一个事件。参数可以是特定事件,例如,-e sched:sched_switch,或者是一个系统组的所有事件,例如,-e sched。允许使用多个 -e。仅当设置了 -t 或 -a 时才激活。
--filter <过滤器>
使用 <过滤器> 过滤之前的 -e sys:事件 事件。有关事件过滤的更多信息,请参阅 https://linuxkernel.org.cn/doc/html/latest/trace/events.html#event-filtering。
- --trigger <触发器>
为之前的 -e sys:事件 启用一个跟踪事件触发器。如果激活了 hist: 触发器,输出直方图将自动保存到名为 system_event_hist.txt 的文件中。例如,命令
rtla <命令> <模式> -t -e osnoise:irq_noise --trigger=”hist:key=desc,duration/1000:sort=desc,duration/1000:vals=hitcount”
将自动将与 osnoise:irq_noise 事件关联的直方图的内容保存到 osnoise_irq_noise_hist.txt 中。
有关事件触发器的更多信息,请参阅 https://linuxkernel.org.cn/doc/html/latest/trace/events.html#event-triggers。
-P, --priority o:优先级|r:优先级|f:优先级|d:运行时间:周期
为 osnoise 跟踪器线程设置调度参数,设置优先级的格式为
o:优先级 - 使用 SCHED_OTHER 和 优先级;
r:优先级 - 使用 SCHED_RR 和 优先级;
f:优先级 - 使用 SCHED_FIFO 和 优先级;
d:运行时[us|ms|s]:周期[us|ms|s] - 使用 SCHED_DEADLINE,运行时和周期单位为纳秒。
-C, --cgroup[=cgroup]
为跟踪器的线程设置 cgroup。如果 -C 选项在没有参数的情况下传递,跟踪器的线程将继承 rtla 的 cgroup。否则,线程将被放置在传递给选项的 cgroup 上。
--warm-up s
在启动工作负载后,让它运行 s 秒,然后再开始收集数据,允许系统预热。预热期间生成的统计数据将被丢弃。
- --trace-buffer-size kB
为跟踪输出设置每个 CPU 的跟踪缓冲区大小,单位为 kB。
-h, --help
打印帮助菜单。
示例¶
在下面的示例中,rtla hwnoise 工具被设置为在启用了超线程的 8 核/16 线程系统上的 CPU 1-7 上运行。
该工具被设置为检测任何高于 1 微秒的噪声,运行 10 分钟,并在会话结束时显示报告摘要。
# rtla hwnoise -c 1-7 -T 1 -d 10m -q
Hardware-related Noise
duration: 0 00:10:00 | time is in us
CPU Period Runtime Noise % CPU Aval Max Noise Max Single HW NMI
1 #599 599000000 138 99.99997 3 3 4 74
2 #599 599000000 85 99.99998 3 3 4 75
3 #599 599000000 86 99.99998 4 3 6 75
4 #599 599000000 81 99.99998 4 4 2 75
5 #599 599000000 85 99.99998 2 2 2 75
6 #599 599000000 76 99.99998 2 2 0 75
7 #599 599000000 77 99.99998 3 3 0 75
第一列显示 CPU,第二列显示工具在会话期间运行了多少 周期。 运行时 是该工具在 CPU 上有效运行的时间。 噪声 列是该工具观察到的所有噪声的总和,而 % CPU 可用 是 运行时 和 噪声 之间的关系。
最大噪声 列是该工具在单个周期中检测到的最大硬件噪声,而 最大单次 是看到的最大单次噪声。
HW 和 NMI 列显示工具观察到的 硬件 和 NMI 噪声发生总数。
例如,CPU 3 运行了 599 个 1 秒运行时 的周期。CPU 在整个执行过程中接收了 86 us 的噪声,为应用程序留下了 99.99997% 的 CPU 时间。在最差的单个周期中,CPU 对应用程序造成了 4 us 的噪声,但这肯定是由多个单次噪声引起的,因为 最大单次 噪声为 3 us。CPU 有 HW 噪声,速率为 每十分钟六次。CPU 也有 NMI,频率更高:大约 每秒七次。
在理想情况下,该工具应报告 0 硬件相关噪声。例如,通过禁用超线程以消除硬件噪声,并禁用 TSC 监视器以消除 NMI(可以使用 rtla hwnoise 的跟踪选项来识别这一点),可以在相同的硬件上达到理想状态。
# rtla hwnoise -c 1-7 -T 1 -d 10m -q
Hardware-related Noise
duration: 0 00:10:00 | time is in us
CPU Period Runtime Noise % CPU Aval Max Noise Max Single HW NMI
1 #599 599000000 0 100.00000 0 0 0 0
2 #599 599000000 0 100.00000 0 0 0 0
3 #599 599000000 0 100.00000 0 0 0 0
4 #599 599000000 0 100.00000 0 0 0 0
5 #599 599000000 0 100.00000 0 0 0 0
6 #599 599000000 0 100.00000 0 0 0 0
7 #599 599000000 0 100.00000 0 0 0 0
另请参阅¶
rtla-osnoise(1)
Osnoise 跟踪器文档:<https://linuxkernel.org.cn/doc/html/latest/trace/osnoise-tracer.html>
作者¶
由 Daniel Bristot de Oliveira <bristot@kernel.org> 编写
报告错误¶
将错误报告给 <linux-kernel@vger.kernel.org> 和 <linux-trace-devel@vger.kernel.org>
许可证¶
rtla 是在 GNU GPLv2 许可下获得许可的自由软件
复制¶
版权所有 (C) 2021 Red Hat, Inc. 在 GNU 公共许可证 (GPL) 的条款下授予此软件的免费使用权。