Load average

Dic 14, 2010

Hace tiempo que quería escribir esta pequeña nota sobre algo que genera demasiada confusión, el load average.

El load average o media de carga de un sistema es un conjunto de tres números que podemos ver en diversas herramientas como uptime o top. Estos números representan el número medio de procesos del sistema que durante los últimos 1, 5 y 15 minutos han estado esperando por algún recurso del sistema (CPU, acceso a disco, red, etc.).

[root@local ~]# uptime
 19:26:28 up 4 days, 22:58,  5 users,  load average: 4.35, 4.30, 3.59
[root@local ~]# top
top - 19:26:54 up 4 days, 22:59,  5 users,  load average: 4.32, 4.20, 3.90
...

En el ejemplo la salida del comando 4.30 significa que durante los últimos 5 minutos una media de 4.30 procesos han sido bloqueados esperando por alguna asignación de recursos. Cuando alguna de estas tres cifras es muy alta no significa necesariamente que la CPU esté sobrecargada, hay otro tipo de herramientas como top, vmstat, iostat, vnstat, etc que podemos usar con la finalidad de averiguar que procesos o recursos están afectados.

Nota: Este artículo es una traducción, la fuente original del artículo en inglés, Redes Privadas Virtuales, un gran blog que se ha convertido en visita obligada para cualquier sysadmin. Me he tomado la libertad de traducirlo puesto que es un tema muy interesante y, como dice el original, genera bastante confusión.