Angeforderte Inhalte anzeigen lassen HTTP Header

  • Hi!

    ich bin jetzt schon langsam am verzweifeln und zwar würde ich gerne ein Programm schreiben was in der Lage ist die vom Internet Browser angeforderten elemente einsehen zu können.
    Das heißt quasi ich möchte auf eine Homepage verbinden und von dieser Homepage möchte ich alle Links einsehen können zu angeforderten Daten wie zum Beispiel Bildern oder sonstiges.

    Ich hoffe dass, das irgendwie lösbar ist

    Danke schonmal für eure Hilfe

  • hm
    aufgrund deiner detaillierten fehlerbeschreibung kann ich dir folgendes raten:
    Hier
    Hier

    und Hier
    die wusst ich noch auswendig, kannst ja mal die suche oder das hier verwenden.
    huii^^
    ich weiß nicht ob es dir hilft, aber schaden tut es bestimmt nicht

    Padmak

  • Also Bilder würde ich wie folgt holen: UNGETESTET!!! ich machs heute abend nochmal richtig!

    [autoit]

    $string = '<img src="test1" />'
    $return = StringRegExp($string, "^\<img(.*)src\=(\"|\')(.*?)(\"|\')$",1)

    [/autoit]

    MFG FireFlyer

    *Paradox ist, wenn man sich im Handumdrehen den Fuss bricht* :D

  • Ich hab jetzt mal ein wenig herumprobiert und ich krieg immer nur den Seiten Quelltext.
    Ich weiß nicht ob jemand das Plugin für FireFox kennt das nennt sicht Live HTTP headers, schreibt neben zu wenn ich irgend eine Seite öffne alle angeforderten Daten auf zumbeispiel

    Code
    #request# GET http://homepagename/123632/123215/213213.jpg
    #request# GET http://homepagename/123632/123215/261221313.jpg
    #request# GET http://homepagename/123632/123215/613213.jpg
    #request# GET http://homepagename/123632/12321513/2213.jpg
    #request# GET http://homepagename/123632/21713.jpg

    Wenn ich aber auf die Seite gehe und den Quelltext jetzt anschaue dann krieg ich ein Problem und zwar stehen diese Bilder manchmal garnicht da drinnen, deswegen muss es irgendwie mitloggen können welche Datein angefordert wurden. Also im Prinzip brauch ich nicht den Quelltext sondern ich brauch diese Daten die aufgrund des Quelltextes irgendwann vom Browser angefordert oder aufgerufen werden, das heißt das Programm mus mitloggen was der Browser anfordert oder öffnet weil der Browser öffnet ja nicht nur Dinge die im Quelltext stehen, wenn der Quelltext zumbeispiel sagt das eine swf datei aufgerufen werden soll und diese SWF datei ruft eine andere Datei auf die im Browser geöffnet wird dann müsste im prinzip folgendes im Programm stehen:

    Code
    #request# GET http://homepagename/123632/hallo.swf
    #request# GET http://homepagename/123632/bild_was_die_swf_datei_aufgerufen_hat.jpg

    Diese Bilddatei wie in meinem beispiel wird also definitiv nicht im Quelltext erscheinen, da die swf Datei ja das Bild aufruft und swf Datein kann man nicht einfach so einsehen, deswegen brauch ich ne funktion die einfach wie schon gesagt mitloggt was der Browser jetzt wirklich gerade öffnet.

    2 Mal editiert, zuletzt von GreenRanger (9. Februar 2009 um 17:16)

  • Es sollte mit AutoIT sein, weil ich sonst von AutoIT keinen direkten zugriff auf die Datein habe.

  • Spoiler anzeigen
    [autoit]

    #include <array.au3>
    #include <inet.au3>
    $string = _INetGetSource("www.autoit.de")
    $return = StringRegExp($string, "<img(?:.*?)src=(?:""|')(.*?)(?:""|')", 3)
    _ArrayDisplay($return)

    [/autoit]


    Für die Bilder z.b. das hier

    MFG FireFlyer

    *Paradox ist, wenn man sich im Handumdrehen den Fuss bricht* :D

  • nein das geht auch über die Source, die Sachen die er meint stehen nicht im header drinne. wie z.B. bei tape.tv die links zu den videos oder anderen Medieninhalten die darüber angefordert werden

  • kann man die medieninhalte die angefordert werden nicht irgendwie auf irgend ne art und weiße einsehen?