_IE Text auslesen

  • Wie kann ich aus dem Quellcode einer Internetseite bestimmte Inhalte auslesen?

    Hier ein Beispiel, indem ich einen Titel, und eine Aufzählung von Ländern in einer Variablen speichern möchte.
    Allerdings weiß ich nicht so ganz, wie ich das anstellen kann...

    PHP
    <table class="title-infos">
    	<tr>
    		<th>Original Titel: </th>
    			<td>Hier ist der Titel</td>
    		<th>Land: </th>
    			<td><a href="...">USA</a>, <a href="...">Deutschland</a>, <a href="...">Großbrita.</a>, <span class="title-more-infos" onclick="$(this).hide().next().show();">weiter</span><span style="display:none;"><a href="...">Großbritannien</a></span></td>
    	</tr>
     </table>

    Einmal editiert, zuletzt von MasterOfTime (29. Mai 2011 um 19:26)

  • [autoit]

    #include<inet.au3>
    #include<string.au3>
    $source= _inetgetsource("http://autoit.de/index.php?page=UsersOnline")
    $string= _stringbetween($source, '<div class="containerHead"><h3>Es sind ', '</h3></div>')
    Msgbox(0, "User", "Es sind " & $string[0])

    [/autoit]

    [align=center]Meine Werke mit der Irrlicht Engine
    AutoIt Picture Viewer Dreidimensionaler Bildbetrachter
    Mr Bubble 3D Neue Interpretation des Flashklassikers Bubble trouble

  • Danke.
    Ich habe so weitergemacht, wie ich es deinem Script und der Hilfe entnehmen konnte.
    Allerdings habe ich jetz einen Fehler.

    Wenn ich die Daten in einen Array lese, und ausgeben lasse, kommt folgenes heraus:

    [autoit]

    <td>TITEL</td>

    [/autoit]
  • Ähm wenn du <td> weg haben willst, kannst du ggf. die Parameter 2&3 von _stringbetween ändern.
    Oder du nimmst stringreplace($array[0], "<td>", "")
    Stringreplace ersetzt in diesem Fall die <td>'s mit Leerzeichen

    [align=center]Meine Werke mit der Irrlicht Engine
    AutoIt Picture Viewer Dreidimensionaler Bildbetrachter
    Mr Bubble 3D Neue Interpretation des Flashklassikers Bubble trouble

  • Danke,
    Ich habe das Problem jetz aber anders gelöst :)

    Für die, die es interessiert:
    Ich habe

    [autoit]

    _stringbetween

    [/autoit]


    So oft benutzt, bis nur noch mein Titel über war :D