Benutzer-Werkzeuge

Webseiten-Werkzeuge


heiko:tipps:hilfsprogramme:tip_wget_01

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
heiko:tipps:hilfsprogramme:tip_wget_01 [2018/08/18 12:57]
Heiko Teichmeier
— (aktuell)
Zeile 1: Zeile 1:
- 
-Spiegelung des SuSE-update-Mirrors: 
-=================================== 
-lin-server:~ # 
-wget -t 5 -r -m -c -nH ftp://ftp.htwk-leipzig.de/pub/suse.com/ftp.suse.com/suse/i386/update/8.1 --limit-rate=65k --proxy=off --cut-dirs=2 
-~~NOCACHE~~ 
-~~META: 
-date issued = 2008-01-01 
-~~ 
-{{tag>[linux hilfsprogramm ftp web http download wget syntax befehle heiko_teichmeier glauchau sachsen]}} 
-===== wget (1) - Die Antwort auf alle HTTP- und FTP-Download-Fragen ===== 
-__letzte inhaltliche Überarbeitung:__ 01.01.2008 
-===== 1. Einführung ===== 
-[[http://www.gnu.org/software/wget/wget.html|(GNU) wget]] ist ein HTTP- und FTP-Download-(Kommandozeilen)-Programm. Es ist eine OpenSourceSoftware unter der GPL. In der Zwischenzeit ist **'wget'** außer für Linux auch für viele andere Betriebssysteme erhältlich. So existiert ein Port auf Windows. Ergänzend zum Windows-Port des Kommandozeilenprogramms gibt es das GUI-Frontend [[http://lab1.de/Central/Software/Internet/Download/Easy-Wget/|Easy-Wget]]. In dieser Verbindung erhält man einen sehr leistungsfähigen //"Website"-Grabber// zum Nulltarif. 
- 
-Das Programm ist extrem flexibel und kann auch die kompliziertesten Aufgaben erfüllen - sofern man die Syntax beherrscht. Deshalb zu Beginn ein paar Syntax-Grundlagen: 
- 
-===== 2. Syntax ===== 
-==== 2.1 Kommandozeile ==== 
-- Grundschema eines Aufrufes 
-<sxh bash; gutter: false> 
-wget [option]... [url]... 
-</sxh> 
-- Varianten der "URL" für HTTP- und FTP-Server-Abrufe 
-<sxh bash; gutter: false> 
-http://host[:port]/verzeichnis/datei 
-ftp://host[:port]/verzeichnis/datei 
-</sxh> 
-- "URL" f&uuml;r HTTP- und FTP-Server-Abrufe mit eingebundenem Username:Passwort-Paar für eine evtl. notwendige Authentifizierung (am Web- oder FTP-Server) 
-<sxh bash; gutter: false> 
-http://username:passwort@host[:port]/verzeichnis/datei 
-ftp://username:passwort@host[:port]/verzeichnis/datei 
-</sxh> 
-- wenn bei FTP-Verbindung kein Username mitgegeben wird, wird automatisch 'anonymous' verwendet, wenn nicht angegeben wird als Passwort die eigene E-Mail-Adresse verwendet.\\ 
-- <hl red>Achtung!>/hl> Die hier angegebenen Daten werden unverschlüsselt, im Klartext über das Netzwerk übertragen! 
- 
-==== 2.2 einfache Optionen für den Anfang ==== 
-Die Optionen sind, wie auch bei anderen Linux-Programmen und -Befehlen in einer kurzen (mit einem "Minus") oder in einer langen Schreibweise (mit zwei "Minus") möglich. 
-<sxh bash; gutter: false> 
-'-V' 
-'--version' 
-   Anzeige/Abfrage der verwendeten Programmversion. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-h' 
-'--help' 
-   Anzeige der Kommandozeilenoptionen und kurzer &Uuml;berblick zur 
-   anzuwendenden Syntax. 
-</sxh> 
-<sxh bash; gutter: false> 
-`-b' 
-`--background' 
-   Das Programm geht nach dem Start mit dieser Option in den 
-   Hintergrund. Wenn keine Ausgabedatei (mit Option '-o') 
-   angegeben wurde, wird die Ausgabe standardm&auml;&szlig;ig nach 
-   'wget-log' geleitet. 
-</sxh> 
-<sxh bash; gutter: false> 
-`-e command' 
-`--execute command' 
-   F&uuml;hrt einen Befehl aus als wenn dieser in der Optionsdatei 
-   '.wgetrc' stehen w&uuml;rde. Der so angegebene Befehl wird nach 
-   den in der Datei '.wgetrc' stehenden Befehlen ausgef&uuml;hrt, 
-   so dass der hier angegebene Befehl faktisch "&uuml;ber" denen 
-   aus der Optionsdatei steht. 
-</sxh> 
- 
-==== 2.3 Optionen zum Logging und Eingabe- /Ausgabe-Datei ==== 
-<sxh bash; gutter: false> 
-'-V' 
-'--version' 
-   Anzeige/Abfrage der verwendeten Programmversion. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-o Ausgabe-Datei' 
-'--output-file=Ausgabe-Datei' 
-   Schreibt alle Logmeldungen (die sonst auf die Standardkonsole 
-   ausgegeben w&uuml;rden) in die Logdatei "Ausgabe-Datei" 
-</sxh> 
-<sxh bash; gutter: false> 
-'-a Ausgabe-Datei' 
-'--append-output=Ausgabe-Datei' 
-   Wie vorher. Aber: Wenn Ausgabe-Datei schon vorhanden ist, 
-   werden neue Meldungen nur angeh&auml;ngt (append), die alte Datei 
-   wird nicht &uuml;berschrieben. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-d' 
-'--debug' 
-   Ausgabe zus&auml;tzlicher "Debug"-Infos (Fehlersuche). 
-   Dazu muss 'wget' mit debug-Unterst&uuml;tzung kompiliert worden 
-   sein! 
-</sxh> 
-<sxh bash; gutter: false> 
-'-q' 
-'--quiet' 
-   Unterdr&uuml;ckung der Ausgabe von Meldungen. 
-</sxh> 
-<sxh bash; gutter: false> 
-`-v' 
-`--verbose' 
-   Schaltet die ausf&uuml;hrliche Meldungsausgabe ein. Die 
-   Standardeinstellung ist 'verbose'. 
-</sxh> 
-<sxh bash; gutter: false> 
-`-nv' 
-`--non-verbose' 
-   Schaltet die ausf&uuml;hrlichen Meldungen aus, ist aber nicht 
-   komplett "stumm". Dazu muss die Option '-q' oder '---quiet' 
-   benutzt werden. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-i Eingabe-Datei' 
-'--input-file=Eingabe-Datei' 
-   Liest die abzurufenden Dateien/URL's aus der Textdatei 
-   "Eingabe-Datei". 
-</sxh> 
-<sxh bash; gutter: false> 
-'-F' 
-'--force-html' 
-   Eingabe-Datei als HTML-Datei behandeln. Erm&ouml;glicht das 
-   Verwenden relativer Links. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-B URL' 
-'--base=URL' 
-   In Verbindung mit '-F' Angabe einer Basis-URL als Vorsatz 
-   f&uuml;r die relativen Links in der mit '-i' angegebenen 
-   URL-Quell-Datei. 
-</sxh> 
- 
-==== 2.4 Download-Optionen ==== 
-<sxh bash; gutter: false> 
-'--bind-adress=ADDRESSE' 
-   Binden an bestimmte IP-Adresse. Hilfreich bei Rechnern 
-   mit mehreren IP-Adressen (Steuerung welche IP-Adresse 
-   als Quelle der Anfrage &uuml;bergeben wird). M&ouml;glich als 
-   IP-Adresse oder Host-Name. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-t ANZAHL' 
-'--tries=ANZAHL' 
-   Anzahl der Wiederholungsversuche angeben (bei 
-   nichterfolgreichen Abrufen). 
-</sxh> 
-<sxh bash; gutter: false> 
-'-O Datei-Name' 
-'--output-document=Datei-Name' 
-   Die abgerufenen Dateien werden aneinandergeh&auml;ngt 
-   und in eine gro&szlig;e Datei 'Datei-Name' geschrieben. 
-   Wenn 'Datei-Name' schon vorhanden ist, wird die 
-   Datei &uuml;berschrieben. 
-   Diese Option setzt '-t' automatisch auf 1. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-nc' 
-'--no-clobber' 
-   Eine mehrfach abgerufene Datei, die in das selbe 
-   Verzeichnis geschrieben wird, bewirkt ein &Uuml;berschreiben 
-   der Ursprungsdatei. 
-   Wenn 'wget' ohne '-N', '-nc' oder '-r' aufgerufen wird, 
-   wird die Originaldatei erhalten und jede weitere mit 
-   gleichem Namen mit einem jeweils um 1 erh&ouml;hten numerischen 
-   Zusatz, beginnend bei 1, in das Verzeichnis kopiert. 
-   (Bsp.: Datei Datei.1 Datei.2) 
-</sxh> 
-<sxh bash; gutter: false> 
-'-c' 
-'--continue' 
-   Fortsetzen von unterbrochenen Downloads. 
-</sxh> 
-<sxh bash; gutter: false> 
-'--progress=[dot|bar]' 
-   Festlegung der Fortschritts-Anzeige-Elemente. 
-   M&ouml;glich sind 'dot' - Punkte, oder 'bar' - senkrechte 
-   Striche. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-N' 
-'--timestamping' 
-   "Einschalten" der &Uuml;berpr&uuml;fung des Zeitstempels, d.h. es 
-   werden nur Dateien geladen deren Zeitstempel (letzte &Auml;nderung) 
-   neuer ist als bei der lokal vorhandenen Datei. 
-</sxh> 
-<sxh bash; gutter: false> 
-'-S' 
-'--server-response' 
-   Zeigt die zur&uuml;ckgesendeten Header der HTTP-Server und die 
-   Antworten der FTP-Server an. 
-</sxh> 
-<sxh bash; gutter: false> 
-'--spider' 
-   Wget verh&auml;lt sich wie ein 'Web-Spider'. Die Dateien werden 
-   nicht heruntergeladen, es wird nur das Vorhandensein der 
-   Datei &uuml;berpr&uuml;ft. 
-   z.Bsp. Kontrolle der G&uuml;ltigkeit der Bookmark-Links: 
-   wget --spider --force-html -i bookmarks.html 
-</sxh> 
-<sxh bash; gutter: false> 
-'-T Sekunden' 
-'--timeout=Sekunden' 
-   Setzt den Lese-Timeout auf 'Sekunden'. Standardm&auml;&szlig;ig ist 
-   dieser auf 900 s (15 min) gesetzt. 
-</sxh> 
-<sxh bash; gutter: false> 
-'--limit-rate=Menge' 
-   Setzt ein max.-Limit f&uuml;r die Downloadrate. Dadurch Festlegung 
-   des Einflusses auf die anderen Download-User - man ist ja 
-   nicht allein im LAN! 
-   Angabe mit Zusatz 'k' -> kBytes/s, 'M' -> MBytes/s 
-   (Bsp.: --limit-rate=90k -> Begrenzung auf 90 kBytes/s) 
-</sxh> 
-<sxh bash; gutter: false> 
-`-w seconds' 
-`--wait=seconds' 
-   Wartet die angegebene Anzahl an Sekunden zwischen den 
-   Abrufen. 
-   Die Benutzung dieser Option ist zu empfehlen, um die Server- 
-   Last durch etwas seltenere Anfragen gering zu halten. 
-   Die Zeitangabe kann statt der standardm&auml;&szlig;ig verwendeten 
-   Zeiteinheit in Sekunden auch in Minuten (durch Verwendung 
-   des 'm' hinter der Zeitangabe), Stunden ('h'-Erweiterung) 
-   oder in Tagen ('d'-Erweiterung) erfolgen. 
- 
-   Angabe eines gro&szlig;en Wertes ist empfehlenswert, wenn das 
-   Netzwerk oder der Ziel-Host u.U. "down" ist, so dass Wget 
-   lange genug mit einer wiederholten Anfrage wartet bis evtl. 
-   der Fehler behoben ist. 
-</sxh> 
-<sxh bash; gutter: false> 
-`--waitretry=seconds' 
-   Wenn Sie nicht wollen, dass Wget zwischen jeder Abfrage so 
-   lange wartet, sondern nur bei fehlgeschlagenen Abrufen, 
-   dann benutzen Sie diese Option. Wget wird nach jedem 
-   fehlgeschlagenen Abruf die Wartezeit bis zum n&auml;chsten 
-   Versuch um 1 Sekunde erh&ouml;hen, bis die maximale, hier 
-   angegebene, Zeit erreicht ist. 
-   Bsp.: Wert = 10 
-         1 + 2 + ... + 10 = 55 Sekunden 
- 
-   Beachte dass diese Option standardm&auml;&szlig;ig in der globalen 
-   'wgetrc'-Datei aktiviert ist. 
-</sxh> 
-<sxh bash; gutter: false> 
-`--random-wait' 
-   Manche Web-Sites analysieren die Zeit zwischen den Abrufen 
-   von Downloads um solche Abruf-Programme wie Wget an den 
-   gleichm&auml;&szlig;igen Mustern zu erkennen. Diese Option bewirkt 
-   eine variierende Wartezeit zwischen den Anfragen in einem 
-   Bereich von 0 bis 2 * 'wait' Sekunden. 
-</sxh> 
-<sxh bash; gutter: false> 
-`-Y on/off' 
-`--proxy=on/off' 
-   Aktivieren der Proxy-Unterst&uuml;tzung. Diese ist standardm&auml;&szlig;ig 
-   aktiviert, wenn die entsprechende Umgebungsvariable 
-   definiert ist. 
-</sxh> 
-<sxh bash; gutter: false> 
-`-Q quota' 
-`--quota=quota' 
-   Festlegen von Download-Quotas (Begrenzungen) f&uuml;r 
-   automatische Abrufe. Der Wert kann in Bytes (Standard), 
-   Kilobytes (mit 'k' Zusatz) oder Megabytes (mit 
-   'm'-Zusatz) angegeben werden. 
- 
-   Beachte dass Quotas nie auf den Download einer einzelnen 
-   Datei wirken. Sie wirken nur wenn mehrere Dateien abgerufen 
-   werden sollen. 
- 
-   Setzen des Quotas auf '0' oder 'inf' hebt das Download- 
-   Limit wieder auf. 
-</sxh> 
  
heiko/tipps/hilfsprogramme/tip_wget_01.1534589833.txt.gz · Zuletzt geändert: 2018/08/18 12:57 von Heiko Teichmeier