Druckversion des Themas

Hier klicken um das Topic im Orginalformat anzusehen

technoboard.at _ Computer, Hardware & Software _ Internetseiten mit wget speichern

Geschrieben von: kidrock1985 22 Jan 2008, 08:53

Hallo habe eine Frage:
Ich will mir mit wget ganze Internetseiten speichern. Bisher kein Problem. Funktioniert auch mit einer Schleife der diverse Seiten hintereinander runterlädt.- Wie mache ich das jedoch wenn die Seite zuerst meinen Login brauch ??

Bitte um Antworten!

Geschrieben von: antidote 22 Jan 2008, 10:26

hab mal ein bisschen in der doku gestöbert.
müsste über HTTP-Options zu regeln sein:

ZITAT
--http-user=user
--http-password=password
Specify the username user and password password on an http server. According to the type of the challenge, Wget will encode them using either the basic (insecure) or the digest authentication scheme.

Another way to specify username and password is in the url itself (see URL Format). Either method reveals your password to anyone who bothers to run ps. To prevent the passwords from being seen, store them in .wgetrc or .netrc, and make sure to protect those files from other users with chmod. If the passwords are really important, do not leave them lying in those files either—edit the files and delete them after Wget has started the download.


allerdings könnte es sein, dass du als zusätzliche option noch die authentifizierungsart übergeben musst.

viel erfolg.

Geschrieben von: kidrock1985 22 Jan 2008, 11:07

mhh verstehe ich jetzt nicht ganz wie müsste dann mein wget Befehl lauten????

Geschrieben von: antidote 22 Jan 2008, 11:12

wget [hier stehen deine optionen] --http-user=maxmustermann --http-password=einamogi

ansonsten kann dir vielleicht auch eine der unzähligen GUIs weiterhelfen.
für mehr bin ich nicht gut wink.gif einfach mal in der doku stöbern.

Geschrieben von: Electromancer 22 Jan 2008, 11:52

So wie beschrieben funkt die Sache, dann aber nur, wenn HTTP Basic Authentication verwendet wird (ein Browser-Eigenes Authentifizierungs-Fenster aufgeht!)!
Seiten, die andere Authentifizierung verlangen, sind mit wget zwar auch machbar, dann wirds aber schon eher kompliziert! Da gehts dann mit Curl fast einfacher wink.gif

lg.roman

Geschrieben von: Alpha600 22 Jan 2008, 14:00

Wie schade, dass es kein Manual gibt in dem das genau drinnen steht: http://www.gnu.org/software/wget/manual/wget.html

QUOTE
# Log in to the server. This can be done only once.
wget --save-cookies cookies.txt \
--post-data 'user=foo&password=bar' \
http://server.com/auth.php

# Now grab the page or pages we care about.
wget --load-cookies cookies.txt \
-p http://server.com/interesting/article.php


Curl: http://curl.haxx.se/docs/httpscripting.html

Wenn jemand nicht einmal versucht etwas im Internet zu finden ist RTFM glaub ich passend.

Geschrieben von: antidote 22 Jan 2008, 14:26

ja dass es sowas gibt.
erwarten doch tatsächlich so unfassbare individuen dass ihnen geholfen wird ohne blöde sprüche.
zum glück haben wir alpha600 der sämtliche schwarzen schafe bekehren und mit seiner unergründlichen weisheit segnen wird.
aber mal im ernst: cool dass du die lösung mitgegeben hast, aber der verweis auf die doku könnte nun ernsthaft weniger gönnerhaft und abwertend ausfallen. ansonsten spar's dir einfach wenn's dir zuviel is.

Geschrieben von: Alpha600 22 Jan 2008, 20:08

QUOTE(antidote @ 22 Jan 2008, 14:26 ) *
erwarten doch tatsächlich so unfassbare individuen dass ihnen geholfen wird ohne blöde sprüche.


Ich wisch mir halt auch schon selber den Hintern ab und ruf nicht mehr nach der Mama. Wie war das doch gleich .. gib einem Mann einen Fisch und du machst ihn für einen Abend satt, lehr ihn zu fischen und du machst ihn fürs ganze Leben satt. Deswegen schadet es nicht wenn jeman mit einer Frage das nächste mal Google oder Wikipedia (besser die Englische) bemüht.

Im Gegensatz dazu kommen von dir natürlich nur mehr blöde Sprüche. Schicks mir einfach als PM (Auf den Namen -> Send Message) - da können es die anderen leichter ignorieren.

Unterstützt von Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)