Cómo instalar y usar wget en Mac

Hay muchas formas de descargar recursos de la web. Además de tu navegador, también puedes utilizar una herramienta como wget para descargar recursos de la Web mientras haces otra cosa. En este artículo, le mostramos cómo descargar y usar wget en Mac.
Lea también: Cómo utilizar Wget para descargar sitios web a su PC
¿Qué es wget (y para qué se utiliza)?
Para los que no lo saben, wget es una utilidad de línea de comandos no interactiva de código abierto que le ayuda a descargar recursos desde una URL específica. Debido a que no es interactivo, wget puede funcionar en segundo plano o incluso antes de iniciar sesión.
Es un proyecto del equipo GNU y es fantástico si tienes una mala conexión a Internet. Esto significa que es robusto en condiciones que de otro modo no serían óptimas.
Una vez que instales wget, ejecutarás comandos y especificarás un destino para tus archivos. A continuación te mostramos cómo hacer esto.
Cómo instalar wget en Mac
Antes de instalar wget, necesita un administrador de paquetes. Si bien wget no viene con macOS, puedes descargarlo e instalarlo usando Homebrew, el mejor administrador de paquetes de Mac disponible.
1. Descargue e instale Homebrew
Para instalar Homebrew, primero abra una ventana de Terminal y ejecute el siguiente comando:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Esto utiliza el curl
comando para descargar archivos que se incluyen dentro de la instalación de Ruby preinstalada en macOS.
Lea también: Cómo utilizar cURL para la transferencia de datos de la línea de comandos y más
Una vez que presione Ingresar Para ejecutar el comando, el instalador le dará detalles explícitos sobre lo que sucederá.

Después de confirmar, se ejecutará el instalador.
2. Instale wget desde la línea de comando
A continuación, queremos usar Homebrew para instalar wget. Desde la Terminal nuevamente, ejecute:

El instalador le brindará actualizaciones de progreso en vivo y hay poco que deba hacer aquí. El proceso es sencillo y automatizado. Sin embargo, si ya tiene Homebrew instalado, asegúrese de ejecutar brew update
para obtener las copias más recientes de todas sus fórmulas.
Una vez que vea un nuevo mensaje en su Terminal, estará listo para usar wget en Mac para descargar recursos.
Lea también: Cómo ejecutar un script de Python en Mac
Cómo utilizar wget para descargar recursos web
Para descargar un recurso remoto desde una URL usando wget, querrás usar la siguiente estructura:
wget -O path/to/local.copy http://example.com/url/to/download.html
Eso guardará el archivo especificado en la URL en la ubicación especificada en su máquina.

Si excluyes el -O
"bandera", su ubicación de descarga será el directorio de trabajo actual.

Por ejemplo, queremos descargar una página web a la carpeta Descargas:
wget -O /Users/(your-username)/Downloads/status.html https://www.w3.org/Status.html
Sin embargo, hacer lo mismo sin el -O
bandera, necesitaríamos cambiar el directorio (cd downloads
) antes de ejecutar wget:
wget /Users/(your-username)/Downloads/status.html https://www.w3.org/Status.html
Obtendrá todos los detalles sobre el progreso de la descarga, aunque, dada la velocidad de wget, esta información es similar a un resumen de la descarga en lugar de actualizaciones en tiempo real.
Cómo descargar un directorio recursivo
Para descargar un árbol de directorios completo con wget, necesita usar el -r
/--recursive
y -np
/--no-parent
banderas:
wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/
Esto hará que wget siga los enlaces que se encuentren en los documentos dentro del directorio especificado. Desde allí realizará una descarga recursiva de toda la ruta URL especificada.
Además, tenga en cuenta la -e robots=off
dominio. Esto ignora las restricciones en el archivo robots.txt. En general, es una buena idea desactivar robots.txt para evitar descargas abreviadas.
Usando banderas adicionales con wget
Descubrirá que wget es una herramienta flexible, ya que utiliza otras opciones adicionales. Esto es excelente si tiene requisitos específicos para su descarga.
Echemos un vistazo a dos áreas de nuestro enfoque en controlar el proceso de descarga y crear registros.
Controle cómo wget descargará recursos
Hay muchas opciones que le ayudarán a configurar el proceso de descarga. Éstos son sólo algunos de los más útiles:
wget -X /absolute/path/to/directory
excluirá un directorio específico en el servidor remoto.wget -nH
elimina los directorios de "nombre de host". En otras palabras, omite el nombre de dominio principal. Por ejemplo, wget se saltaría elwww.w3.org
carpeta en el ejemplo anterior y comience con laHistory
directorio en su lugar.wget --cut-dirs=#
omite el número especificado de directorios en la URL antes de comenzar a descargar archivos. Por ejemplo,-nH --cut-dirs=1
cambiaría la ruta especificada de “ftp.xemacs.org/pub/xemacs/” a simplemente “/xemacs/” y reduciría la cantidad de directorios principales vacíos en la descarga local.wget -R index.html
/wget --reject index.html
omitirá cualquier archivo que coincida con el nombre de archivo especificado. En este caso, excluirá todos los archivos de índice. el asteriscowget -i file
es un comodín, como “*.png”. Esto omitiría todos los archivos con la extensión PNG.--force-html
especifica las URL de destino de un archivo de entrada. Este archivo de entrada debe estar en formato HTML, o necesitarás usar elwget -nc
bandera para analizar el HTML.wget --no-clobber
/wget -c
no sobrescribirá los archivos que ya existen en el destino.wget --continue
/wget -t 10
Continuará con las descargas de archivos parcialmente descargados.
Intentará descargar el recurso hasta 10 veces antes de fallar.
wget puede hacer más que controlar el proceso de descarga, ya que también puede crear registros para referencia futura.
Ajustar el nivel de registro
wget -d
También puede considerar las siguientes opciones como una forma parcial de controlar la salida que recibe cuando usa wget.wget -o path/to/log.txt
habilita la salida de depuración.wget -q
permite registrar la salida en el directorio especificado en lugar de mostrar la salida estándar de inicio de sesión.wget -v
desactiva toda la salida de wget, incluidos los mensajes de error.wget --no-verbose
habilita explícitamente la salida detallada predeterminada de wget.
desactiva los mensajes de registro pero muestra mensajes de error.
A menudo querrás saber qué sucede durante una descarga, por lo que es posible que no utilices estos indicadores tanto como otros. Aún así, si tiene un gran lote de descargas y quiere asegurarse de poder solucionar cualquier problema, tener un registro o falta de resultados es un enfoque válido. Lea también:
Cómo agregar y eliminar Kexts de macOS
Conclusión
Si bien puedes usar tu navegador u otra GUI para descargar páginas web y otros recursos, puedes ahorrar tiempo con la línea de comando. Una herramienta como wget es poderosa (más que su navegador) y también ágil. Para obtener una descripción completa de las capacidades de wget, puede revisar la página de manual de GNU de wget.
Si descubre que wget no funciona, puede que sea el momento de diagnosticar un problema con su conexión Wi-Fi. ¿Usarás wget en Mac para descargar recursos web? ¡Comparte tus pensamientos en la sección de comentarios a continuación!
¡Suscríbete a nuestro boletín!
Tom Rankin es un escritor de contenido de calidad para WordPress, tecnología y pequeñas empresas. Cuando no está tocando el teclado con los dedos, se le puede encontrar tomando fotografías, escribiendo música, jugando juegos de computadora y hablando en tercera persona.