Compresión: tar.gz vs tar.bz2

Es una pena que no me haya dado por medir el tiempo de generación del tar.gz pero no pienso repetirlo. Hace unos días ha tocado hacer una compresión de un archivo de 51Gb. de texto plano y -como siempre- he tirado de tar.gz sin siquiera pensar en otras alternativas. 5.1Gb clavados.

La duda ha venido días más tarde cuando, al no ubicar bien el comprimido, un rsync se lo ha llevado por delante (descanse en paz). Tenía que repetir la tarea así que me he puesto el mono de trabajo y he intentado mejorar los números:

# ls -lash access.log*
51G -rw-r--r-- 1 root root 51G nov 26 18:50 access.log.1
# time tar -c access.log.1 | bzip2 > access.log.tar.bz2
real    455m52.499s
user    441m41.704s
sys     2m19.301s

Le ha llevado lo suyo, 7 horas y media aproximadamente... veamos el resultado:

# ls -lash access.log*
 51G -rw-r--r-- 1 root root  51G nov 26 18:50 access.log.1
2,6G -rw-r--r-- 1 root root 2,6G dic 18 01:30 access.log.tar.bz2

No está nada mal, de 51Gb. que tiene el archivo original pasamos a 5.1Gb. con el tar.gz y a 2.6Gb. del tar.bz2. ¿Merece la pena?, imagino que -como todo- depende de varios factores críticos entre los que se encuentra la paciencia humana.

About the author

Óscar
has doubledaddy super powers, father of Hugo and Nico, husband of Marta, *nix user, Djangonaut and open source passionate.