¿Cómo copiar una página web entera? Existen multitud de herramientas como httrack, Website Ripper Copier, o Scrapbook. A veces nos encontramos con clientes que acuden a nosotros para hacer un rediseño completo de su página web, pero su sitio fue desarrollado hace muchos años y no tienen acceso al FTP o han perdido los datos.
Como es lógico, en la mayoría de casos guardamos una copia del sitio web antiguo, “por si las moscas”, y porque mientras está en marcha el proyecto de desarrollo del nuevo sitio, muchas veces se migra de hosting y necesitamos tener una copia del sitio anterior funcionando.
wget nuestra herramienta favorita
Una de nuestras herramientas favoritas para copiar un sitio web entero es wget, que suele estar con casi total seguridad instalada en todas las distribuciones de Linux, o en Mac OS a través de Homebrew. También hay versión para Windows.
Copiar el sitio es muy sencillo, y lo podremos hacer con una sola línea de comando. Abrimos una terminal, creamos una carpeta en la que alojar los archivos, y ejecutamos wget con los siguientes parámetros:
¿Para qué sirve cada parámetro que le pasamos a wget?
- –domains misitio.com,www.misitio.com fuerza a wget a descargar contenido sólo del dominio que le digamos. Podemos especificar varios separándolos por coma
- –mirror activa parámetros necesarios para hacer una copia completa (recursividad, etc)
- –page-requisites permite bajar todos los “requisitos” necesarios para que funcione el sitio web, como las imágenes, hojas de estilo CSS, JavaScripts, etc
- –adjust-extension ajusta las extensiones de los archivos. Por ejemplo, si tenemos un sitio web con muchas páginas dinámicas con extensión asp, wget las guardará en nuestro ordenador con la extensión html.
- –wait=(numero) es interesante si queremos esperar un número determinado de segundos entre petición y petición, útil por ejemplo si no queremos saturar el servidor con peticiones.
De este modo podemos copiar un sitio web de forma fácil, y en muchas ocasiones, sin necesidad de utilizar o instalar herramientas externas.
No hay comentarios