inetread nicht komplett?

  • Guten Morgen zusammen,

    ich habe folgendes Problem:
    Der Quellcode der heruntergeladen wird, ist bei manchen Seiten nicht komplett!

    Download-Beispiel

    [autoit]


    #include <array.au3>
    #include <String.au3>

    [/autoit][autoit][/autoit][autoit]

    $sSource= BinaryToString(inetread("http://www.herz-fuer-tiere.de/kleinanzeigen/private-anzeige-aufgeben.html",8),4)
    MsgBox(0,"",$sSource)
    ClipPut($sSource)

    [/autoit]

    Das sieht soweit ok aus,
    ist es aber nicht!
    Diese Seite hat z.B. Tabellenbereiche/Formularbereiche u.v.m. z.B. <tbody>
    und die sind im Quelltext der downgeloaded wurde nicht enthalten! Wieso?

    Das wäre z.B. der Quelltext v. <tbody> (der Formularbereich der Linkseite) der nicht downgeloaded wird!

    Spoiler anzeigen


    <tbody><tr bgcolor="#f1f1f1">
    <td valign="middle" align="right" colspan="3" class="fett">Schritt 1 von 3</td>
    </tr>
    <tr bgcolor="#f1f1f1">
    <td valign="middle" align="left" colspan="3" class="fett">Kleinanzeige aufgeben:</td>
    </tr>
    <tr bgcolor="#f1f1f1">
    <td valign="middle" align="left" colspan="3" class="fett">Mit Stern ( * ) gekennzeichnete Felder müssen ausgefüllt werden</td>
    </tr>
    <tr>
    <td width="222" valign="middle" bgcolor="#f1f1f1" align="left" class="normal">Vorname *</td>
    <td bgcolor="#f1f1f1" colspan="2" class="normal">Name *</td>
    </tr>
    <tr align="left">
    <td width="222" valign="middle" bgcolor="#f1f1f1" class="normal">
    <input type="text" value="" class="normal" size="15" name="firstName">
    </td>
    <td valign="middle" bgcolor="#f1f1f1" class="normal" colspan="2">
    <input type="text" value="" class="normal" size="15" name="lastName">
    </td>
    </tr>
    <tr bgcolor="#f1f1f1" align="left">
    <td width="222" valign="middle" class="normal">Straße/Hausnummer *</td>
    <td width="35" valign="middle" class="normal">PLZ *</td>
    <td width="163" valign="middle" class="normal">Ort *</td>
    </tr>
    <tr align="left">
    <td width="222" valign="middle" bgcolor="#f1f1f1" class="normal">
    <input type="text" value="" class="normal" size="30" name="street">
    </td>
    <td width="35" valign="middle" bgcolor="#f1f1f1" class="normal">
    <input type="text" value="" class="normal" size="5" name="zip">
    </td>
    <td width="163" valign="middle" bgcolor="#f1f1f1" class="normal">
    <input type="text" value="" class="normal" size="10" name="city">
    </td>
    </tr>
    <tr bgcolor="#f1f1f1" align="left">
    <td valign="middle" class="normal">Telefonnummer * </td>

    <td valign="middle" class="normal" colspan="2">Soll die Telefonnummer auf
    der Webseite angezeigt werden?</td>
    </tr>
    <tr align="left">
    <td bgcolor="#f1f1f1" class="normal" colspan="valign=&quot;middle&quot;">
    <input type="text" value="" class="normal" size="25" name="telefon">
    </td>
    <td valign="middle" bgcolor="#f1f1f1" class="normal" colspan="2">
    <input type="radio" value="1" name="showTel">Ja <input type="radio" checked="" value="0" name="showTel"> Nein
    </td>
    </tr>

    <tr bgcolor="#f1f1f1" align="left">
    <td valign="middle" class="normal">E-Mail * </td>

    <td valign="middle" class="normal" colspan="2">Soll die E-Mail Adresse auf
    der Webseite angezeigt werden?</td>
    </tr>
    <tr align="left">
    <td valign="middle" bgcolor="#f1f1f1" class="normal">
    <input type="text" value="" class="normal" size="25" name="email">
    </td>
    <td valign="middle" bgcolor="#f1f1f1" class="normal" colspan="2">
    <input type="radio" value="1" name="showEmail">Ja <input type="radio" checked="" value="0" name="showEmail"> Nein
    </td>
    </tr>

    <tr bgcolor="#f1f1f1" align="left">
    <td valign="middle" class="normal" colspan="3">Die Anzeige wird geschaltet:</td>
    </tr>
    <tr align="left">
    <td valign="middle" bgcolor="#f1f1f1" class="normal" colspan="3">
    <input type="checkbox" value="1" name="adsOnline"> auf der Webseite&nbsp;
    <input type="checkbox" value="1" name="adsOffline"> Im Heft
    </td>
    </tr>
    <tr bgcolor="#f1f1f1" align="center">
    <td valign="middle" colspan="3">
    <input width="76" vspace="2" type="image" height="20" border="0" src="/kleinanzeigen/content/ka_weiter.gif" name="saveAd">
    </td>
    </tr>
    </tbody>

    Kann man irgendwie des gesamten Quelltext/incl. Frames...downloaden?

    Grüße
    Ilse ;)

    Einmal editiert, zuletzt von Ilse (27. Mai 2011 um 15:20)

  • tbody ist ein Element, das meistens nicht angegeben wird weil man das nicht muss. Firefox ergänzt das automatisch, sodass die Anzeige per FireBug oder Auswahlquelltext anzeigen diese anzeigt. Das normale "Quelltext anzeigen" zeigt dir den Originalquellcode. Dieser enthält nichts dergleichen.

  • Hallo Progandy,

    hm..., nicht nur tbody, sondern auch select u.vm
    D.h. diesen Vorgang kann man so nicht automatisieren?
    Kein Download des Quelltextes mit allen Angaben?

    Das würde also viel Handarbeit je Seite mit Firebug & Co...bedeuten.

    Oder hast du da noch eine andere Idee?

    Liebe Grüße
    Ilse ;)

  • Der Originalcode enthält dohc alles, was du brauchst... Das Formular ist komplett da:

    PHP
    <form name="adForm" action="/kleinanzeigen/private-anzeige-aufgeben.html" method="POST">
    ...
    </form>

    Gib mir mal ein Beispiel, welcher Codeteil fehlt, den du unbedingt benötigst?

  • Hallo Progandy,

    hm..das ist leider nicht so.
    Ich habe mal irgend eine Seite genommen:
    Da wir bald alle Urlaubsreif sind...

    [autoit]


    http://www.opodo.de/pauschalreisen…lreisen-de.html

    [/autoit]

    Der Quellcode enthält nach dem download z.B. keinen tbody
    Da würden aber die Inhalte stehen die ich z.B. haben möchte.
    Bräuchte ich z.B. die Info "Nahstrecke" im Feld Reiseziel
    dann würde ich im Quelltext nichts finden!

    Bei diesem Beispiel müsste ich hier suchen: <div id="suchpod">

    Ich kann zwar nach <div id="suchpod"> im Quelltext suchen
    aber alle Inhalte hierzu wie z.B. Nahstrecke...fehlen!
    An diese kommt man nur über Handarbeit, Tools...ran.

    Es werden nur die Formfelder im Quellcode gezeigt.
    Und das würde bedeuten: Inetread downloaded nicht komplett. Oder?

    Liebe Grüße
    Ilse ;)

  • Die Seite wird komplett runtergeladen. Diese Inhalte werden per Javascript erstellt, das wird natürlich nicht ausgeführt. Die Daten stehen in diesem JS: http://www.opodo.de/pauschalreisen…-de/lm-suche.js

    Übrigens solltest du dir mal die AGB ansehen:

    Zitat

    f) Die Website und deren Inhalt dürfen von dem Nutzer nicht verändert, vervielfältigt, weitergegeben, verkauft, veröffentlicht oder in irgendeiner Art wiedergegeben werden. Zulässig ist jedoch die Anfertigung einzelner Kopien der Seite für Ihre private, nicht-gewerbliche Nutzung.

  • Hallo Progandy,

    merci nochmal, auch für deinen AGB Hinweis!
    Ich habe und werde auch in Zukunft nichts mit Reisen... zu tun haben.
    Es sei denn ich mach mal Urlaub.
    War einfach nur ein Beispiel.
    Bei manchen Combifeldern benötige ich z.B. Inhalte (ähnlich wie bei Opodo)
    z.B. Hunderassen, Tiernamen...
    Ob man so etwas darf, werd ich mir gleich mal ansehen.

    Liebe Grüße
    Ilse ;)