Descargar una pagina web con wget

Si tiene la necesidad de descargar una web ya sea al completo o parcialmente, es posible hacerlo con wget:

1
2
3
4
5
6
7
wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--domains makeinstall.es \
www.makeinstall.es

A continuación la explicación de cada parámetro:

  • --recursive, sigue todos los links, es decir, descargará la página web al completo.
  • --no-clobber, no sobreescribe los archivos existentes. Es útil en caso de que el proceso fuese interrumpido y se desee retomar lo de nuevo.
  • --page-requisites, descarga todos los elementos de la página (imágenes, CSS, js…)
  • --html-extensions, guarda los archivos con extensión .html.
  • --domains, permite limitar la descarga al dominio indicado. Esta opción es necesaria si usa --recursive.

Otras opciones que pueden ser útiles son:

  • --no-parent, permite limitar la descarga a un directorio concreto. Ejemplo: --no-parent 2016/ limitaría la descarga a las páginas que esten dentro del directorio 2016.
  • --convet-links, convierte los enlaces absolutos a enlaces relativos de forma que la web funcione en local (off-line).
Contenidos