Text aus Webseite auslesen

  • Hi

    Erst mal vorweg die Infos was ich machen will.

    Ich will den Text einer Webseite IMDB Auslesen also die Crew Infos.

    Beispiel:

    http://www.imdb.com/title/tt0120689/fullcredits#cast

    Die Crew Infos sollen ausgelesen werden und dann in ein XML File bzw Zwischenablage in dem Format.

    Die Infos sollen dann in den DVD Profiler 2.x

    Nun wollte ich mit dem Script

    C
    ; *******************************************************
    ; Beispiel 1 - öffnet einen Browser mit dem basic-Beispiel, ließt den body Text
    ;           	(der Inhalt mit allen HTML-Tags entfernt) und zeigt ihn in einer MsgBox
    ; *******************************************************
    ;
    #include <IE.au3>
    $oIE = _IE_Example ("basic")
    $sText = _IEBodyReadText ($oIE)
    MsgBox(0, "Body Text", $sText)

    Anfangen von hier
    [ offen ] text aus internetseite auslesen("basic")#post47918

    nur ich habe keine Ahnung wie ich da die URL angeben soll. Da steht _IECreate aber die IE.AU3 ist riesig.

    kann mir da jemand auf die Sprünge helfen?

    Ach ja bitte halbwegs mit Erklärung bin kein Profi. :P

  • [autoit]


    #include <IE.au3>
    $oIE = _IECreate("http://www.imdb.com/title/tt0120689/fullcredits#cast")
    $sText = _IEBodyReadText ($oIE)
    MsgBox(0, "Body Text", $sText)

    [/autoit]


    _IE_Example() ist nur ein Beispiel, der nur zeigen soll, wie die ganzen _IE Funktionen arbeiten.
    Und IE.au3 musst du auch nicht direkt lesen. Wenn du Hilfe öffnest, links oben auf "Index" klickst und z.B. _IECreate eingibst, bekommst du eine relativ ausführliche Beschreibung der Funktion mit einem Skriptbeispiel.
    Und wenn du Fragen hast, hier wird gerne geholfen.

  • Hallo Koto,

    schau dir die Hilfe zu

    [autoit]

    _IECreate

    [/autoit]

    an oder mache es gleich mit

    [autoit]

    _INetGetSource

    [/autoit]

    damit kannst du den Quelltext einer Seite auslesen,

    mfg (Auto)Bert