nur bestimmte werte aus html code auslesen

  • hallo an alle,

    ich komm leider nicht weiter, hab schon alles versucht eine txt mit html-code auszulesen. (hab die datei angehängt)
    es soll nur noch folgende werte übrig bleiben, der username und die userID
    hier mein bisheriges script:

    Spoiler anzeigen
    [autoit]

    #include<File.au3>
    #include <Array.au3>

    [/autoit] [autoit][/autoit] [autoit]

    $Path = "user.txt"
    $hFile = FileOpen($Path)
    $sRead = FileRead($hFile)
    FileClose($hFile)

    [/autoit] [autoit][/autoit] [autoit]

    $aSplit = StringSplit($sRead, 'href="userview.php?userid=', 1)
    _ArrayDisplay($aSplit)

    [/autoit]

    schon mal nicht schlecht denn dann hab ich schonmal das richtige in strings gepackt. jedoch ist noch sehr viel müll dabei:

    beispiel:

    PHP
    [spoiler][21]6920">-Nina-</a></td>
    	<td>Holzingen</td>
        <td><a href="friend_del.php?del=6920"><img src="myps/templates/images/dell.gif" border=0></a></td>
      </tr>
      <tr> 
        <td><a [/spoiler]

    ich möchte das in diesem fall jetzt nur noch "-Nina-" und "6920" übrig bleibt und das am besten in 2 variablen
    hab mir schon viel angesehn aber der html-text ist zu flexibel um bestimmte werte einfach abzuschneiden.. ?(

    außerdem hab ich schon herausgefunden, dass es wohl möglich ist einen html code direkt von einer seite bzw nur vom arbeitsspeicher auszulesen,
    ohne den code lokal zu speichern - geht das, bzw wie? könnte mir vorstellen das (wie in meinem fall zu große datenmengen den pc lahm machen

    über jede hilfe wäre ich sehr dankbar.

    gruß Inferior

    Einmal editiert, zuletzt von Inferior (5. Juli 2010 um 16:57)

  • Zitat

    außerdem hab ich schon herausgefunden, dass es wohl möglich ist einen html code direkt von einer seite bzw nur vom arbeitsspeicher auszulesen,
    ohne den code lokal zu speichern - geht das, bzw wie?

    Das ginge mit _INetGetSource().

    Was genau möchtest du dir denn da aus dem Quelltext holen? Jeweils user ID und username?

  • hallo ideas2code,

    genau das hab ich gesucht.. wusste doch das es das gibt ;)
    das ist jedoch jetzt denke ich nicht ganz so wichtig.. mir geht es vorrangig um die umsetztung überflüssigen code heraus zu filtern.

    genau, wie in dem beispiel oben beschrieben
    der PHP-Quelltext ist ein teil des ganzen codes
    und dort befindet sich einmal der username und die userID und nur die brauch ich

  • Spoiler anzeigen
    [autoit]

    #include <Array.au3>
    $file="user.txt"
    $result=StringRegExp(FileRead($file), '<a href="userview.php\?userid=(\w*)">', 3)
    _ArrayDisplay($result)
    $result=StringRegExp(FileRead($file), '<a href="userview.php\?userid=\w*">([\w- .ß\[\]öäü]*|())</a>', 3)
    _ArrayDisplay($result)

    [/autoit]
  • bevor hier Support geleistet wird, bereits aus dem Impressum heraus ist zu entnehmen dass es nicht gestattet ist. Du solltest also den DownLoadLink entfernen

    Zitat

    Urheberrecht
    Alle Rechte vorbehalten. Sämtliche Texte, Bilder und andere in der Website und im Magazin veröffentlichten Informationen unterliegen größtenteils dem Copyright von GuniWeb Internetdienste. Jede Vervielfältigung, Verbreitung, Speicherung, Sendung und Wieder- bzw. Weitergabe der Inhalte ist ohne Genehmigung von GuniWeb Internetdienste ausdrücklich untersagt. Änderungen und Irrtümer bleiben vorbehalten.

    MoD bitte prüfen und evtl. schliessen,

    danke (Auto)Bert

  • wow super ineluki!
    das klappt ja schon mal sehr gut. hätte nicht gedacht das es so einfach geht.
    jedoch ist doch jetzt, so vermute ich doch mal die zusammengehörigkeit nicht mehr gegeben oder?
    gibt es ne möglichkeit userID und username, die du mir ja wirklich klasse schon isoliert hast, in ein verhältnis zu bringen
    am besten ein _ArrayDisplay in dem 2 spalten mit username und unserID sind
    ist das auch möglich?

  • bevor hier Support geleistet wird, bereits aus dem Impressum heraus ist zu entnehmen dass es nicht gestattet ist. Du solltest also den DownLoadLink entfernen

    MoD bitte prüfen und evtl. schliessen,

    danke (Auto)Bert

    hallo AutoBert,

    ich verstehe deine gründlichkeit in sachen forumsregeln, denke aber kaum das der quellcode einer öffentlich zugänglichen seite ein geheimnis ist
    es werden keine veränderungen noch vervielfältigungen noch missbrauch bestimmter quellcode-schnippsel von GuniWeb vorgenommen
    will doch nur 2dinge draus auslesen, die an sich ja kein geheimnis sind.

  • Hallo Inferior,

    auch Namenslisten sind Inhalt dieser Seite, also ist auch das Einstellen der TXT-Datei hier auf AutoIt bereits ein Verstoss, oder hast du die Erlaubnis dazu.

    mfg (Auto)Bert

  • Ok ich habe den anhang mal herausgenommen.
    wie gesagt es ist ja nur ne abfrage und eine auslese. ich möchte damit niemanden schaden.

    kann mir den jemand sagen wie ich die beiden arrays in ein ArrayDisplay bekomme, so das spalte 1 username und spalte 2 userID ist?


    Spoiler anzeigen
    [autoit]

    #include <Array.au3>

    [/autoit] [autoit][/autoit] [autoit]

    $file="user.txt"
    $result1=StringRegExp(FileRead($file), '<a href="userview.php\?userid=(\w*)">', 3)
    $result2=StringRegExp(FileRead($file), '<a href="userview.php\?userid=\w*">([\w- .ß\[\]öäü]*|())</a>', 3)

    [/autoit] [autoit][/autoit] [autoit]

    _ArrayDisplay($result1)
    _ArrayDisplay($result2)

    [/autoit]