Aspirer un site SPIP avec HTTRACK

Sous ubuntu en mode console

Cette procédure sert à enregistrer une version statique de votre site SPIP pour un cédérom ou une version dîtes « Hors connexion ».

Rien de bien sorcier en fait, si ce n’est de faire attention à ce qu’aucun fichier robots.txt ne viennent empêcher le travail de httrack.

Installer Httrack

Très simple, rendez-vous sur la documentation du site Ubuntu-fr.org.

Installation de Httrack

Aspiration du site

Dans la console taper : httrack et suivez les indications à la lettre :

Welcome to HTTrack Website Copier (Offline Browser) 3.42+libhtsjava.so.2
Copyright (C) Xavier Roche and other contributors
To see the option list, enter a blank line or try httrack —help

Enter project name : Entrez ici le nom du répertoire qui stockera votre projet

Base path (return=/home/user/websites/) : Le dossier qui contient tous vos projet, appuyez sur « entrer » pour laisser par defaut

Enter URLs (separated by commas or blank spaces) : http://localhost/spip_cederom/ Les adresses des sites à aspirer séparés par des points-virgules ou des espaces.

Action :
(enter) 1 Mirror Web Site(s)
2 Mirror Web Site(s) with Wizard
3 Just Get Files Indicated
4 Mirror ALL links in URLs (Multiple Mirror)
5 Test Links In URLs (Bookmark Test)
0 Quit
_ : Pour une simple copie de vôtre site choisissez 1 ou appuyez directementsur « entrer »

Proxy (return=none) : Indiquez l’adresse de vôtre serveur proxy ou appuyez sur « entrer » pour continuer

You can define wildcards, like : -*.gif +www.*.com/*.zip -*img_*.zip
Wildcards (return=none) : Les éventuelles extensions à exclure sinon appuyez sur « entrer »

You can define additional options, such as recurse level (-r), separed by blank spaces
To see the option list, type help
Additional options (return=none) : Option additionnelles, sinon appuyez sur « entrer »

— -> Wizard command line : httrack http://localhost/spip_cederom/ -O « /home/user/websites/Cederom » -%v

Ready to launch the mirror ? (Y/n) : Y ou n pour lancer la procédure.

Mirror launched on Wed, 17 Dec 2008 10:29:53 by HTTrack Website Copier/3.42+libhtsjava.so.2 [XR&CO’2007]
mirroring http://10.0.0.31/images/ with the wizard help..
Done.
Thanks for using HTTrack !
*

Voilà, rendez-vous dans votre répertoire « /home/user/websites/ » par défaut pour voir votre projet.

En laissant toutes les options par défaut, vous enregistrerez toutes les images et documents de votre site.

Laissez Httrack faire son job, la procédure peut être assez longue.

Attention à ce qu’aucun fichier .htaccess ou robots.txt ne viennent empêcher HTTRACK de faire correctement son job.

Dernière modification de cette page le 17 décembre 2008

Discussion

Aucune discussion

Ajouter un commentaire

Qui êtes-vous ?

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Ajouter un document

Suivre les commentaires : RSS 2.0 | Atom