Benutzer-Werkzeuge

Webseiten-Werkzeuge


heiko:tipps:hilfsprogramme:tip_wget_01

Dies ist eine alte Version des Dokuments!


Spiegelung des SuSE-update-Mirrors:

lin-server:~ # wget -t 5 -r -m -c -nH ftp://ftp.htwk-leipzig.de/pub/suse.com/ftp.suse.com/suse/i386/update/8.1 –limit-rate=65k –proxy=off –cut-dirs=2

wget (1) - Die Antwort auf alle HTTP- und FTP-Download-Fragen

letzte inhaltliche Überarbeitung: 01.01.2008

1. Einführung

(GNU) wget ist ein HTTP- und FTP-Download-(Kommandozeilen)-Programm. Es ist eine OpenSourceSoftware unter der GPL. In der Zwischenzeit ist 'wget' außer für Linux auch für viele andere Betriebssysteme erhältlich. So existiert ein Port auf Windows. Ergänzend zum Windows-Port des Kommandozeilenprogramms gibt es das GUI-Frontend Easy-Wget. In dieser Verbindung erhält man einen sehr leistungsfähigen „Website“-Grabber zum Nulltarif.

Das Programm ist extrem flexibel und kann auch die kompliziertesten Aufgaben erfüllen - sofern man die Syntax beherrscht. Deshalb zu Beginn ein paar Syntax-Grundlagen:

2. Syntax

2.1 Kommandozeile

- Grundschema eines Aufrufes

wget [option]... [url]...
- Varianten der „URL“ für HTTP- und FTP-Server-Abrufe
http://host[:port]/verzeichnis/datei
ftp://host[:port]/verzeichnis/datei
- „URL“ für HTTP- und FTP-Server-Abrufe mit eingebundenem Username:Passwort-Paar für eine evtl. notwendige Authentifizierung (am Web- oder FTP-Server)
http://username:passwort@host[:port]/verzeichnis/datei
ftp://username:passwort@host[:port]/verzeichnis/datei
- wenn bei FTP-Verbindung kein Username mitgegeben wird, wird automatisch 'anonymous' verwendet, wenn nicht angegeben wird als Passwort die eigene E-Mail-Adresse verwendet.
- <hl red>Achtung!>/hl> Die hier angegebenen Daten werden unverschlüsselt, im Klartext über das Netzwerk übertragen!

2.2 einfache Optionen für den Anfang

Die Optionen sind, wie auch bei anderen Linux-Programmen und -Befehlen in einer kurzen (mit einem „Minus“) oder in einer langen Schreibweise (mit zwei „Minus“) möglich.

'-V'
'--version'
   Anzeige/Abfrage der verwendeten Programmversion.
'-h'
'--help'
   Anzeige der Kommandozeilenoptionen und kurzer &Uuml;berblick zur
   anzuwendenden Syntax.
`-b'
`--background'
   Das Programm geht nach dem Start mit dieser Option in den
   Hintergrund. Wenn keine Ausgabedatei (mit Option '-o')
   angegeben wurde, wird die Ausgabe standardm&auml;&szlig;ig nach
   'wget-log' geleitet.
`-e command'
`--execute command'
   F&uuml;hrt einen Befehl aus als wenn dieser in der Optionsdatei
   '.wgetrc' stehen w&uuml;rde. Der so angegebene Befehl wird nach
   den in der Datei '.wgetrc' stehenden Befehlen ausgef&uuml;hrt,
   so dass der hier angegebene Befehl faktisch "&uuml;ber" denen
   aus der Optionsdatei steht.

2.3 Optionen zum Logging und Eingabe- /Ausgabe-Datei

'-V'
'--version'
   Anzeige/Abfrage der verwendeten Programmversion.
'-o Ausgabe-Datei'
'--output-file=Ausgabe-Datei'
   Schreibt alle Logmeldungen (die sonst auf die Standardkonsole
   ausgegeben w&uuml;rden) in die Logdatei "Ausgabe-Datei"
'-a Ausgabe-Datei'
'--append-output=Ausgabe-Datei'
   Wie vorher. Aber: Wenn Ausgabe-Datei schon vorhanden ist,
   werden neue Meldungen nur angeh&auml;ngt (append), die alte Datei
   wird nicht &uuml;berschrieben.
'-d'
'--debug'
   Ausgabe zus&auml;tzlicher "Debug"-Infos (Fehlersuche).
   Dazu muss 'wget' mit debug-Unterst&uuml;tzung kompiliert worden
   sein!
'-q'
'--quiet'
   Unterdr&uuml;ckung der Ausgabe von Meldungen.
`-v'
`--verbose'
   Schaltet die ausf&uuml;hrliche Meldungsausgabe ein. Die
   Standardeinstellung ist 'verbose'.
`-nv'
`--non-verbose'
   Schaltet die ausf&uuml;hrlichen Meldungen aus, ist aber nicht
   komplett "stumm". Dazu muss die Option '-q' oder '---quiet'
   benutzt werden.
'-i Eingabe-Datei'
'--input-file=Eingabe-Datei'
   Liest die abzurufenden Dateien/URL's aus der Textdatei
   "Eingabe-Datei".
'-F'
'--force-html'
   Eingabe-Datei als HTML-Datei behandeln. Erm&ouml;glicht das
   Verwenden relativer Links.
'-B URL'
'--base=URL'
   In Verbindung mit '-F' Angabe einer Basis-URL als Vorsatz
   f&uuml;r die relativen Links in der mit '-i' angegebenen
   URL-Quell-Datei.

2.4 Download-Optionen

'--bind-adress=ADDRESSE'
   Binden an bestimmte IP-Adresse. Hilfreich bei Rechnern
   mit mehreren IP-Adressen (Steuerung welche IP-Adresse
   als Quelle der Anfrage &uuml;bergeben wird). M&ouml;glich als
   IP-Adresse oder Host-Name.
'-t ANZAHL'
'--tries=ANZAHL'
   Anzahl der Wiederholungsversuche angeben (bei
   nichterfolgreichen Abrufen).
'-O Datei-Name'
'--output-document=Datei-Name'
   Die abgerufenen Dateien werden aneinandergeh&auml;ngt
   und in eine gro&szlig;e Datei 'Datei-Name' geschrieben.
   Wenn 'Datei-Name' schon vorhanden ist, wird die
   Datei &uuml;berschrieben.
   Diese Option setzt '-t' automatisch auf 1.
'-nc'
'--no-clobber'
   Eine mehrfach abgerufene Datei, die in das selbe
   Verzeichnis geschrieben wird, bewirkt ein &Uuml;berschreiben
   der Ursprungsdatei.
   Wenn 'wget' ohne '-N', '-nc' oder '-r' aufgerufen wird,
   wird die Originaldatei erhalten und jede weitere mit
   gleichem Namen mit einem jeweils um 1 erh&ouml;hten numerischen
   Zusatz, beginnend bei 1, in das Verzeichnis kopiert.
   (Bsp.: Datei Datei.1 Datei.2)
'-c'
'--continue'
   Fortsetzen von unterbrochenen Downloads.
'--progress=[dot|bar]'
   Festlegung der Fortschritts-Anzeige-Elemente.
   M&ouml;glich sind 'dot' - Punkte, oder 'bar' - senkrechte
   Striche.
'-N'
'--timestamping'
   "Einschalten" der &Uuml;berpr&uuml;fung des Zeitstempels, d.h. es
   werden nur Dateien geladen deren Zeitstempel (letzte &Auml;nderung)
   neuer ist als bei der lokal vorhandenen Datei.
'-S'
'--server-response'
   Zeigt die zur&uuml;ckgesendeten Header der HTTP-Server und die
   Antworten der FTP-Server an.
'--spider'
   Wget verh&auml;lt sich wie ein 'Web-Spider'. Die Dateien werden
   nicht heruntergeladen, es wird nur das Vorhandensein der
   Datei &uuml;berpr&uuml;ft.
   z.Bsp. Kontrolle der G&uuml;ltigkeit der Bookmark-Links:
   wget --spider --force-html -i bookmarks.html
'-T Sekunden'
'--timeout=Sekunden'
   Setzt den Lese-Timeout auf 'Sekunden'. Standardm&auml;&szlig;ig ist
   dieser auf 900 s (15 min) gesetzt.
'--limit-rate=Menge'
   Setzt ein max.-Limit f&uuml;r die Downloadrate. Dadurch Festlegung
   des Einflusses auf die anderen Download-User - man ist ja
   nicht allein im LAN!
   Angabe mit Zusatz 'k' -> kBytes/s, 'M' -> MBytes/s
   (Bsp.: --limit-rate=90k -> Begrenzung auf 90 kBytes/s)
`-w seconds'
`--wait=seconds'
   Wartet die angegebene Anzahl an Sekunden zwischen den
   Abrufen.
   Die Benutzung dieser Option ist zu empfehlen, um die Server-
   Last durch etwas seltenere Anfragen gering zu halten.
   Die Zeitangabe kann statt der standardm&auml;&szlig;ig verwendeten
   Zeiteinheit in Sekunden auch in Minuten (durch Verwendung
   des 'm' hinter der Zeitangabe), Stunden ('h'-Erweiterung)
   oder in Tagen ('d'-Erweiterung) erfolgen.

   Angabe eines gro&szlig;en Wertes ist empfehlenswert, wenn das
   Netzwerk oder der Ziel-Host u.U. "down" ist, so dass Wget
   lange genug mit einer wiederholten Anfrage wartet bis evtl.
   der Fehler behoben ist.
`--waitretry=seconds'
   Wenn Sie nicht wollen, dass Wget zwischen jeder Abfrage so
   lange wartet, sondern nur bei fehlgeschlagenen Abrufen,
   dann benutzen Sie diese Option. Wget wird nach jedem
   fehlgeschlagenen Abruf die Wartezeit bis zum n&auml;chsten
   Versuch um 1 Sekunde erh&ouml;hen, bis die maximale, hier
   angegebene, Zeit erreicht ist.
   Bsp.: Wert = 10
         1 + 2 + ... + 10 = 55 Sekunden

   Beachte dass diese Option standardm&auml;&szlig;ig in der globalen
   'wgetrc'-Datei aktiviert ist.
`--random-wait'
   Manche Web-Sites analysieren die Zeit zwischen den Abrufen
   von Downloads um solche Abruf-Programme wie Wget an den
   gleichm&auml;&szlig;igen Mustern zu erkennen. Diese Option bewirkt
   eine variierende Wartezeit zwischen den Anfragen in einem
   Bereich von 0 bis 2 * 'wait' Sekunden.
`-Y on/off'
`--proxy=on/off'
   Aktivieren der Proxy-Unterst&uuml;tzung. Diese ist standardm&auml;&szlig;ig
   aktiviert, wenn die entsprechende Umgebungsvariable
   definiert ist.
`-Q quota'
`--quota=quota'
   Festlegen von Download-Quotas (Begrenzungen) f&uuml;r
   automatische Abrufe. Der Wert kann in Bytes (Standard),
   Kilobytes (mit 'k' Zusatz) oder Megabytes (mit
   'm'-Zusatz) angegeben werden.

   Beachte dass Quotas nie auf den Download einer einzelnen
   Datei wirken. Sie wirken nur wenn mehrere Dateien abgerufen
   werden sollen.

   Setzen des Quotas auf '0' oder 'inf' hebt das Download-
   Limit wieder auf.

heiko/tipps/hilfsprogramme/tip_wget_01.1534589833.txt.gz · Zuletzt geändert: 2018/08/18 12:57 von Heiko Teichmeier