Wget est le téléchargeur réseau non interactif qui est utilisé pour télécharger des fichiers depuis le serveur même lorsque l'utilisateur n'est pas connecté au système et il peut fonctionner en arrière-plan sans gêner le processus en cours.
- GNU wget est un utilitaire gratuit de téléchargement non interactif de fichiers depuis le Web. Il prend en charge les protocoles HTTP, HTTPS et FTP, ainsi que la récupération via des proxys HTTP.
- wget n'est pas interactif, ce qui signifie qu'il peut fonctionner en arrière-plan, lorsque l'utilisateur n'est pas connecté. Cela vous permet de démarrer une récupération et de vous déconnecter du système, laissant wget terminer le travail. En revanche, la plupart des navigateurs Web nécessitent la présence constante de l’utilisateur, ce qui peut constituer un obstacle majeur lors du transfert d’un grand nombre de données.
- wget peut suivre des liens dans des pages HTML et XHTML et créer des versions locales de sites Web distants, recréant entièrement la structure de répertoires du site d'origine. C'est ce qu'on appelle parfois le téléchargement récursif. Ce faisant, wget respecte la norme d'exclusion des robots (/robots.txt). wget peut être invité à convertir les liens des fichiers HTML téléchargés en fichiers locaux pour une visualisation hors ligne.
- wget a été conçu pour être robuste sur des connexions réseau lentes ou instables ; si un téléchargement échoue en raison d'un problème de réseau, il réessayera jusqu'à ce que l'intégralité du fichier ait été récupérée. Si le serveur prend en charge la reprise, il lui demandera de poursuivre le téléchargement là où il s'était arrêté.
Syntaxe de base :
La syntaxe de base de la commande Wget est la suivante :
wget [option] [URL]>
Ici
liste doublement chaînée
[options]> représente diverses options de ligne de commande qui modifient le comportement de Wget
[URL]> est l'adresse du fichier ou du site Web à télécharger.
Possibilités :
Voici les options disponibles dans la commande wget sous Linux.
| Option | Description | Syntaxe |
|---|---|---|
| -v / –version | Affichez la version de Wget installée sur votre système. | $ wget -v |
| -h / –aide | Imprimez un message d'aide affichant toutes les options de ligne de commande disponibles pour Wget. | $ wget -h [URL] |
| -o fichier journal | Dirigez tous les messages générés par le système vers le fichier journal spécifié. Si aucun fichier journal n'est spécifié, les messages sont redirigés vers le fichier journal par défaut (« wget-log »). | $ wget -o fichier journal [URL] |
| -b / –arrière-plan | Envoyez le processus en arrière-plan dès qu'il démarre, permettant ainsi aux autres processus de continuer. Si aucun fichier de sortie n'est spécifié, la sortie est redirigée vers « wget-log » par défaut. | $ wget -b [URL] |
| -un | Ajoutez des messages de sortie au fichier journal de sortie actuel sans l'écraser. Cela préserve le journal des commandes précédentes, le journal actuel étant ajouté après elles. | $ wget -un fichier journal [URL] |
| -je | Lire les URL d'un fichier. Si elles sont spécifiées comme fichier, les URL sont lues à partir de l'entrée standard. Si des URL sont présentes à la fois dans la ligne de commande et dans le fichier d’entrée, celles de la ligne de commande sont prioritaires. Il n'est pas nécessaire que le fichier soit un document HTML. | $ wget -i fichier d'entrée $ wget -i fichier d'entrée [URL] |
| -t nombre / –tries=numéro | Définissez le nombre de nouvelles tentatives. Spécifiez « 0 » ou « inf » pour une nouvelle tentative infinie. La valeur par défaut est de 20 tentatives, avec des exceptions pour les erreurs fatales comme le refus de connexion ou le lien introuvable. | $ wget -t numéro [URL] |
| -c | Reprenez un fichier partiellement téléchargé si le fichier prend en charge la reprise. Si la reprise n'est pas prise en charge, le téléchargement ne peut pas être repris. | $ wget -c [URL] |
| -Dans | Configurez le système pour qu'il attende le nombre de secondes spécifié entre les récupérations. Cette option permet de réduire la charge du serveur en espaçant les requêtes. Le temps peut être spécifié en secondes, minutes (m), heures (h) ou jours (d). | $ wget -w nombre_en_secondes [URL] |
| -r | Activez la récupération récursive des liens spécifiés, même en cas d'erreurs fatales. Cette option suit de manière récursive les liens dans l'URL donnée. | $ wget -r [URL] |
Exemple :
1. Pour télécharger simplement une page Web :
Pour télécharger un seul fichier à partir d'une URL, spécifiez simplement l'URL comme suit :
wget http://example.com/sample.php>
2. Pour télécharger le fichier en arrière-plan
Exécutez le processus de téléchargement en arrière-plan à l'aide du-b>ou--background>option:
wget -b http://www.example.com/samplepage.php>
3. Pour écraser le journal lors de l'exécution de la commande wget
Redirigez les messages de sortie vers un fichier journal à l'aide du-o>option:
ajouter une chaîne en Java
wget http://www.example.com/filename.txt -o /path/filename.txt>
4. Pour reprendre un fichier partiellement téléchargé
Si un téléchargement est interrompu, reprenez-le à l'aide du-c>option:
wget -c http://example.com/samplefile.tar.gz>
5. Essayer un nombre de fois donné
Spécifiez le nombre de nouvelles tentatives à l'aide du--tries>option:
wget --tries=10 http://example.com/samplefile.tar.gz>
6. Définir le temps d'attente entre les récupérations :
Définissez le temps d'attente entre les récupérations à l'aide du-w>option (en secondes, minutes, heures ou jours) :
wget -w 10 http://example.com/large_file.zip>
7. Activer la récupération récursive :
Activez la récupération récursive pour télécharger un site Web entier à l'aide du-r>option:
wget -r http://example.com/>
8. Lire les URL du fichier :
Lisez les URL d'un fichier et téléchargez-les à l'aide du-i>option:
Kat Timpf soeur
wget -i urls.txt>
Commande Wget – FAQ
A quoi sert la commande wget ?
La commande wget est un puissant outil de ligne de commande utilisé dans les systèmes Linux et Unix pour récupérer des fichiers sur Internet via les protocoles HTTP, HTTPS et FTP. Il est particulièrement utile pour les téléchargements non interactifs, la mise en miroir de sites Web et les téléchargements récursifs.
Comment télécharger un fichier en utilisant wget ?
Pour télécharger un seul fichier à l'aide de wget, vous pouvez simplement exécuter la commande suivie de l'URL du fichier que vous souhaitez télécharger.
Par exemple:
wget https://example.com/file.zip>
Comment puis-je télécharger un site Web entier à l’aide de wget ?
Pour télécharger un site Web entier de manière récursive, utilisez le
-m>ou--mirror>option avec le-p>ou--page-requisites>option pour télécharger tous les fichiers nécessaires.Par exemple:
wget -m -p https://example.com>
Comment limiter la vitesse de téléchargement ou la bande passante lors de l’utilisation de wget ?
Vous pouvez utiliser le
--limit-rate>option pour limiter la vitesse de téléchargement ou l’utilisation de la bande passante.Par exemple : Pour limiter la vitesse de téléchargement à 500 Ko/s, vous pouvez exécuter :
wget --limit-rate=500k https://example.com/file.zip>
Comment puis-je continuer un téléchargement interrompu à l’aide de wget ?
Si un téléchargement est interrompu, vous pouvez utiliser le
-c>ou--continue>option pour reprendre le téléchargement là où il s'est arrêté.liste de tableaux et liste de liensPar exemple:
wget -c https://example.com/file.zip>
Conclusion
Dans cet article, nous avons discuté de la commande Wget, un outil pratique sous Linux pour télécharger des fichiers depuis Internet sans avoir besoin d'une intervention de l'utilisateur. Il fonctionne silencieusement en arrière-plan, ce qui signifie que vous pouvez démarrer un téléchargement et faire d'autres choses pendant qu'il fonctionne. Wget peut gérer différents types d'adresses Web et peut même copier des sites Web entiers. C’est utile pour les connexions Internet lentes ou peu fiables, car il continue d’essayer de télécharger jusqu’à ce qu’il réussisse. De plus, il offre des fonctionnalités utiles telles que la reprise des téléchargements interrompus et la définition des temps d'attente entre les récupérations. En apprenant ses commandes et options simples, les utilisateurs peuvent gérer efficacement leurs téléchargements et gagner du temps.