Inscription

Vous souhaitez vous inscrire et ainsi participer à faire vivre ce site ? Cliquez-ici et partager vos demandes d'aide informatique avec les Kachouri's

Kachouri.com c'est quoi ?

Totalement gratuit et libre d'accès, ce site est destiné à toutes les personnes désireuses de s'auto-former dans le domaine de l'informatique.

Le forum d'aide

Vous avez besoin d'une aide particulière ? Utilisez notre forum d'aide informatique! Postez et partagez vos astuces avec les autres kachouri's...

Le saviez-vous que vous pouvez obtenenir rapidement votre IP ?

Suivez le guide   Le saviez-vous que vous pouvez obtenenir rapidement votre IP ? (2) commentaires

Catégories

Menu général

Publicité Kachou


HTTrack aspirateur : aspirer vos sites web

Comment aspirer un site Web avec HTTrack aspirateur

Didacticiel informatique réalisé par : Mehdi Kachouri  Ajouté le 19 Avril 2006

I. Introduction à HTTrack Website copier

HTTrack est un aspirateur de sites web facile d'utilisation, il a pour particularité de télécharger un site Internet sur votre disque dur, en conservant tous les répertoires, récupérant HTML, images et fichiers du serveur vers votre ordinateur. Ouvrez simplement une page du site "aspiré" dans votre navigateur et vous pouvez naviguer librement à l'intérieur, comme si vous étiez connecté. HTTrack peut également mettre à jour le contenu d'un site existant ou reprendre un téléchargement interrompu. Le robot est entièrement configurable, avec un système d'aide intégré.

tutorial httrack aspirateur sites web image 1

 

II. Tout s'explique en images

1. Installation du logiciel HTTrack 3.40-2

L'installation de "HTTrack 3.40-2" : vous le lancerai une fois que vous l'aurez téléchargé, le fichier "httrack-3.40-2.exe", et dès lors l'installation commencera d'elle-même comme ceci :

tutorial httrack aspirateur sites web image 2


Faites "Next (Suivant)", jusqu'à obtenir cette fenêtre :

tutorial httrack aspirateur sites web image 3


Il nous restera alors à cliquer sur "Finish (Terminer)" pour terminer cette installation.

2.  L'interface de HTTrack 3.40-2

Avant toute chose vous aurez à choisir votre langue, une fois cette étape effectuée "HTTrack 3.40-2" se relancera et vous aurez alors ceci :

 tutorial httrack aspirateur sites web image 4

3. Aspirer un site web

A présent nous allons aspirer un site web avec "HTTrack 3.40-2", vous aurez tout simplement à cliquer sur le bouton "Suivant" pour démarrer un nouveau projet, puis on vous demandera de remplir les champs suivants : "Nom du nouveau projet" pour mon exemple je vais le nommer ainsi "www.kachouri.com", "Catégorie du projet" ceci afin de trier lorsque vous aurez plein de sites sauvegardés. Pour notre exemple je l'ai nommé "Tutoriels" et en ce qui concerne le "Chemin de base", celui-ci est tout simplement le chemin où sera téléchargé le site en question. Par défaut, il sera ici "C:\Mes Sites Web" si toutefois celui-ci ne vous convient pas, libre à vous de le changer. Voici ce que vous devrez avoir :

 tutorial httrack aspirateur sites web image 5


Puis nous devrons faire "Suivant", on obtiendra alors le "Mode de copie de site automatique" tout en aillant la possibilité de choisir des actions précises à savoir : "Copie automatique de site(s) Web", "Copie interactive de site(s) Web (questions)", "Télécharger des fichiers spécifiques", "Aspirer tous les sites dans les pages (miroirs multiples)", "Tester les liens dans les pages (test de signet)", "* Reprendre une copie interrompue" et "* Mettre à jour une copie existante", comme vous pouvez le remarquer vous avez un choix d'action assez large, pour notre exemple de tutorial nous allons tout simplement choisir "Copie automatique de site(s) Web", puis dans le champ "Adresse Web : (URL)" vous n'aurez qu'à copier coller l'adresse que vous souhaitez aspirer. Pour notre exemple, j'ai choisi "http://www.kachouri.com" ce qui nous donnera ceci :

 tutorial httrack aspirateur sites web image 6


Avant de passer à l'étape suivante, nous allons nous attarder un peu plus sur les "Paramètres de copie du site", pour cela nous allons cliquer sur "Définir les options...", vous devrez avoir alors ceci :

tutorial httrack aspirateur sites web image 7


Comme vous vous en apercevrez, il y a plusieurs options et configurations de "HTTrack 3.40-2", toutes ont leurs utilités. Nous allons nous attarder principalement sur l'onglet "Limites", dont voici un aperçu :

tutorial httrack aspirateur sites web image 8


Pour ce qui est de la "Profondeur maximale" par défaut, la profondeur est infinie mais elle sera limitée par l'emplacement qu'on aura indiqué dans "Adresse Web : (URL)", en quelque sorte il s'agit d'une aspiration interne, il est fort conseillé de limiter cette profondeur selon l'importance du site.

Pour ce qui est de la "Profondeur exterieure" employez cette option avec prudence, car cette méthode d'aspiration consiste à aspirer les cibles (liens) externes au site visé. Dans ce cas elle peut générer un grand nombre de page téléchargées, par défaut elle est de "0" il est fort déconseillé de la changer.

Pour ce qui est de la "Nombre max de liens" : ceux qui peuvent être analysés, c.-à-d., téléchargés, ou non téléchargés. Ne fixez pas une limite trop basse pour cela, parce qu'une fois que la limite est atteinte, le moteur s'arrêtera immédiatement. Ne fixez pas une limite trop élevée, aussi, parce qu'elle prendra une certaine mémoire et un certain temps. Par défaut la limite est 100.000 liens, ceci est généralement bien suffisant pour la plupart des cas.

Pour les autres options je vous conseille de ne pas les modifier, CECI N'EST PAS CONSEILLÉ À MOINS QUE VOUS NE SACHIEZ CE QUE VOUS FAITES !

Voyons à présent de plus près l'onglet "Règles de filtrage" dont voici un aperçu :

tutorial httrack aspirateur sites web image 9


Par défaut la majorité des fichiers présents sur le serveur web seront aspirés, mais vous avez la possibilité d'en exclure ou en ajouter à votre guise. Il vous suffira alors de sélectionner et cliquer soit sur "Liens à exclure..." ou "Liens à inclure...". De plus vous aurez la possibilité de choisir des règles prédéfinies par "HTTrack 3.40-2" afin d'inclure ou d'exclure par mot-clé, les voici "Fichiers de type", "Fichiers contenant", "Ce fichier", "Noms de dossiers contenant", "Ce dossier", "Liens sur ce domaine", "Liens sur un domaine contenant", "Liens de ce serveur", "Liens contenant" ,"Ce lien" ou "TOUS LES LIENS". Une fois vos règles définies, vous pourrez alors passer à l'étape suivante en cliquant sur "Suivant" comme ceci :

tutorial httrack aspirateur sites web image 10


On obtiendra alors ceci :

 tutorial httrack aspirateur sites web image 11


Il vous restera à préciser le cas échéant les options de connexions si cela est nécessaire, plus exactement dans le champ "Fournisseur d'accès" de sélectionner le nom de votre connexion à Internet. Dans la majorité des cas, ce sera le nom de votre fournisseur d'accès. Décochez les deux cases si elles le sont, à savoir "Déconnecter à la fin de l'opération" et "Shutdown PC when finished".
Puis il vous restera alors plus qu'à cliquer sur "Terminer" pour lancer l'aspiration du site "http://www.kachouri.com", on aura alors ceci :

tutorial httrack aspirateur sites web image 12


Voilà le site "http://www.kachouri.com" est en train d'être aspiré... Après quelques minutes vous aurez ceci :

tutorial httrack aspirateur sites web image 13


Vous aurez alors le choix de "Voir le fichier journal" qui donnera un rapport sur les différentes erreurs rencontrées, ou "Explorer la copie du site" comme son nom l'indique vous aurez la possibilité de naviguer sur le site en local et plus besoin d'être connecter à celui-ci (Hors ligne). "Terminer" : dans ce cas vous pourrez le cas échéant lancer un nouveau projet, "Quitter" ceci comme l'indique son nom c'est pour quitter "HTTrack 3.40-2".

III. Conclusion du tutoriel informatique

Voilà un tutorial sur un logiciel qui sert à aspirer des sites et de pouvoir les consulter en mode hors ligne. Il vous suffira, si vous le souhaitez, de garder la copie de ce site sur votre disque dur et à tout moment pouvoir le consulter sans être connecter à Internet. Ce logiciel dispose aussi de nombreuses options fort intéressantes comme le paramétrage d'un proxy, règles de filtrages, programmation de l’heure d’aspiration, et tout ceci dans un seul logiciel à savoir "HTTrack 3.40-2" et de plus il est gratuit. Voilà un outil qui mérite d'avoir une petite place sur votre disque dur.

Partager ce tuto : HTTrack aspirateur : aspirer vos sites web Partager ce tutoriel informatique sur les réseaux sociaux :

Tous les commentaires : HTTrack aspirateur : aspirer vos sites webLes commentaires pour "HTTrack aspirateur : aspirer vos sites web"

Réagir

Les consignes avant de réagir :

Devant être lu par tous types de public, nous vous remercions de rédiger votre commentaire en utilisant le langage le plus clair possible sans faire usage d'abréviations ou de "jargon" SMS (Tout commentaire non conforme à ces consignes ne pourra être validé).

Bienvenue, pour réagir vous devez vous connecter !

Si vous n'avez pas encore de compte sur les forums, allez tout de suite vous inscrire. C'est rapide et gratuit! Vous pourrez ensuite réagir immédiatement aux actualités. En cas de problème, utilisez notre formulaire de contact.

Saisissez vos mots clés :



Newsletter

Saisir votre courriel ici :



Les Kachouri's

Lahcen      contacter les Kachouri (membres) de Kachouri.com
Ismail      contacter les Kachouri (membres) de Kachouri.com
Hajar      contacter les Kachouri (membres) de Kachouri.com
Lem3allem      contacter les Kachouri (membres) de Kachouri.com
Haifa      contacter les Kachouri (membres) de Kachouri.com
Leila      contacter les Kachouri (membres) de Kachouri.com
Kacem      contacter les Kachouri (membres) de Kachouri.com
Yao jeremie      contacter les Kachouri (membres) de Kachouri.com
Martine      contacter les Kachouri (membres) de Kachouri.com
Marc      contacter les Kachouri (membres) de Kachouri.com

Adoptez Kachouri