Analizar texto: Uso de sort y wordcount

Analizar texto: Uso de sort y wordcount

¿Cómo enviar la salida impresa de un comando a un archivo en Linux?

Ya habíamos comentado que el comando head nos permite leer las primeras líneas de un archivo. Si ademas le indicamos el parámetro -n podemos especificar el número de líneas que deseamos leer. Cuando obtenemos la salida de head esta va a un tipo cajón llamado bucket que en Linux se conoce como STDO “Standard Output” o salida estándar. Cuando cualquier cosa es enviada el stdo también es impreso en la pantalla.

Los comandos usan el stdo todo el tiempo, por ejemplo el comando ls envía una lista de archivos y directorios al stdo que luego son impresos, una ventaja de enviar a stdo es que podemos capturar ese envío y manipularlo, por ejemplo podemos enviar la salida de ls a un archivo de texto.

ls -la > archivos.txt

En esta ocasión no se imprime nada en la terminal, pero si vamos a abrir el archivo nos encontraremos que contiene la salida a stdo del comando ls.

Repite nuevamente.

ls -la > archivos.txt

Abre nuevamente el archivo y te darás cuenta que el contenido anterior fue reemplazado. Esta es la forma de operar normal de “>”, ahora reemplacemos por el doble “»”, volvamos a ejecutar el comando y abramos nuevamente el archivo.

ls -la >> archivos.txt
ls -la >> archivos.txt

Ahora nos daremos cuenta que en lugar de borrar el contenido, este se va agregando por la parte inferior del archivo txt.

¿Cómo ordenar líneas de un archivo alfabéticamente en Linux?

Si deseamos ordenar alfabéticamente la salida de stdo podemos hacer uso del comando sort.

sort archivo.txt

¿Cómo agregar una línea en blanco al final de un archivo en Linux?

Una sencilla forma de agregar una línea en blanco al final del archivo podemos usar echo.

echo >> archivo.txt

¿Cómo contar palabras, líneas y caracteres en un archivo Linux?

El comando wc (wordcount) permite contar palabras, líneas y caracteres en uno o varios archivos.

wc -lwc archivo.txt
4  29 164 archivo.txt

En donde:

  • l representa lines (lineas).
  • w representa words (palabras).
  • c representa characters (caracteres).

VPN

  • Ir a la oferta de NordVPN

Moda

Accesorios