Herramientas de compresión y archivado: Tar, gzip y zip

Herramientas de compresión y archivado: Tar, gzip y zip

¿Qué son los archives (archivos)?

Antes de empezar el tema de la compresión en Linux vamos a explicar el concepto de archives. Para traducir la palabra archives tendríamos que referirnos a un catálogo o colección, la palabra también podría entenderse como archivo, pero en este caso el archivo no es un fichero en el sistema operativo sino un lugar en donde se almacenan demasiados documentos, la palabra es usada cuando nos referimos al Archivo de la Nación que guarda documentación importante de carácter histórico, o el Archivo Médico de un Paciente que contiene el historial médico de este.

La finalidad de los archives es funcionar como un sistema de respaldo de información, un lugar que almacena mucha información que no es consultada con gran frecuencia.

¿Para qué sirve el comando tar?

El comando tar permite almacenar un grupo de archivos dentro de uno solo sin aplicar ninguna compresión a estos. El uso original de este comando era crear archives que se pudieran almacenar en cintas magnéticas, de aquí proviene su nombre tar == Tape Archive", a estos archivos se les conocía originalmente como tarballs.

El comando tar tiene muchos parámetros, el que vamos a utilizar en esta ocasión vamos a utilizar el siguiente comando.

tar -cf documentos.tar Documentos
  • El parámetro -c le indica tar que vamos a “crear” un archive.
  • El parámetro -f le indica a tar que vamos a especificar el nombre del archive.
  • Enseguida escribimos el nombre del tar que vamos a crear “documentos.tar”.
  • Finalmente el directorio/archivo que vamos a archivar “Documentos”.

¿Cómo extraer el contenido de un archivo .tar?

Para extraer el contenido del archive utilizamos.

tar -xf documentos.tar
  • El parámetro -x significa extract (extraer).
  • El parámetro -f significa que vamos a proveer el nombre del archivo.
  • Enseguida tenemos el nombre del archivo que vamos a desarchivar “documentos.tar”.

¿Qué significa el término compresión?

La compresión es el proceso mediante el cual un archivo pasa a través de un algoritmo de compresión que tiene la finalidad de crear una nueva versión del archivo cuyo tamaño sea menor que el original.

Existe la posibilidad de realizar compresión durante el proceso de archivado, de forma que el espacio requerido para almacenar los archives sea menor. De igual manera al reducir el tamaño de los archivos, estos pueden enviarse a través de la red en un menor tiempo ya que su tamaño es menor.

¿Para qué se utiliza el formato Gzip?

Este es el formato de compresión mas popular. La compresión con Gzip se va realizando conforme los ficheros se van a los archivos tar, para realizar esta operación utilizamos el parámetro “-z” (zip). Tenga en cuenta que con el comando tar, el orden de los parámetros importa, así que mantenga este orden “czf” para prevenir resultados inesperados. Cuando se crean archivos tar con gzip por lo general se usan dos tipos de extensiones “.tgz” o “.tar.gz”.

¿Cómo se comprime un archivo con gzip?

tar -czf documentos.tar.gz Documentos

¿Cómo se descomprime un archive con gzip?

tar -xvzf documentos.tar.gz

El parámetro -v es utilizado para hacer la descompresión verbosing (detallada) de forma que podamos ir viendo que archivos van siendo extraídos del archive tar.

¿Para qué se utiliza el formato Bzip?

Este es otro tipo de compresión popular utilizado en Linux. El algoritmo de bzip ofrece resultados comparables con el algoritmo de gzip pero requiere de mas cpu para realizar la compresión. Para crear tar archives con compresión gzip utilizamos el parámetro “-j”. Cuando se crean archivos tar con bzip por lo general su extensión es “.tar.bz2”.

¿Cómo comprimir un archivo con bzip?

tar -cjf documentos.tar.bz2 Documentos

¿Cómo extraer un archivo con bzip?

tar -xvjf documentos.tar.bz2

¿Cómo se crea un zip en Linux?

El comando zip es familiar para todos los usuarios de Windows. Es muy sencillo de utilizar ya que no requiere memorizar parámetros y el orden de estos. Es importante tomar en cuenta que si vamos a comprimir un directorio con sus archivos con zip, hay que indicarle que esta compresión debe ser recursiva, de otra forma los archivos del directorio no será incluidos. Para especificar una compresión recursiva existe el parámetro “-r”.

zip -r documentos.zip Documentos

¿Cómo descomprimir un archivo zip en Linux?

Para descomprimir un archivo utilizamos unzip, el primer parámetro requerido es el archivo a descomprimir.

unzip documentos.zip