CPU 负载¶
Linux 通过 /proc/stat
和 /proc/uptime
导出各种信息,用户空间工具(如 top(1))使用这些信息来计算系统在特定状态下花费的平均时间,例如
$ iostat
Linux 2.6.18.3-exp (linmac) 02/20/2007
avg-cpu: %user %nice %system %iowait %steal %idle
10.01 0.00 2.92 5.44 0.00 81.63
...
这里系统认为在默认采样周期内,系统花费了 10.01% 的时间在用户空间工作,2.92% 的时间在内核中,并且总体上 81.63% 的时间处于空闲状态。
在大多数情况下,/proc/stat
信息非常接近现实,但是由于内核收集此数据的方式/时间的性质,有时根本无法信任它。
那么这些信息是如何收集的呢?每当定时器中断发出信号时,内核会查看此时正在运行的任务类型,并增加与此任务类型/状态相对应的计数器。问题在于,系统可能在两次定时器中断之间在各种状态之间切换了多次,但仅针对最后一种状态增加计数器。
例子¶
如果我们想象一个系统,其中一个任务以以下方式定期消耗周期
time line between two timer interrupts
|--------------------------------------|
^ ^
|_ something begins working |
|_ something goes to sleep
(only to be awaken quite soon)
在上述情况下,根据 /proc/stat
,系统将 0% 负载(因为定时器中断将始终在系统执行空闲处理程序时发生),但实际上负载接近 99%。
可以想象更多的情况,内核的这种行为将导致 /proc/stat
中的信息非常不稳定
/* gcc -o hog smallhog.c */
#include <time.h>
#include <limits.h>
#include <signal.h>
#include <sys/time.h>
#define HIST 10
static volatile sig_atomic_t stop;
static void sighandler(int signr)
{
(void) signr;
stop = 1;
}
static unsigned long hog (unsigned long niters)
{
stop = 0;
while (!stop && --niters);
return niters;
}
int main (void)
{
int i;
struct itimerval it = {
.it_interval = { .tv_sec = 0, .tv_usec = 1 },
.it_value = { .tv_sec = 0, .tv_usec = 1 } };
sigset_t set;
unsigned long v[HIST];
double tmp = 0.0;
unsigned long n;
signal(SIGALRM, &sighandler);
setitimer(ITIMER_REAL, &it, NULL);
hog (ULONG_MAX);
for (i = 0; i < HIST; ++i) v[i] = ULONG_MAX - hog(ULONG_MAX);
for (i = 0; i < HIST; ++i) tmp += v[i];
tmp /= HIST;
n = tmp - (tmp / 3.0);
sigemptyset(&set);
sigaddset(&set, SIGALRM);
for (;;) {
hog(n);
sigwait(&set, &i);
}
return 0;
}
参考¶
感谢¶
Con Kolivas, Pavel Machek