HTML analysieren

  • Hey Leute,
    ich weiss das man mit autoit den source code einer website auslesen kann.Wie kann ich nun diesen code durchsuchen und einen bestimmten teil in einer variablen speichern. Es geht hier um einen kleinen downloader den ich bateln moechte. Alle seiten sind immer gleich aufgebaut und in einer zeile des source codes steht z.B


    to.addVariable("video_url","http://beispiel.link.com/dl/135a8b155f246d11adc29069fdbb4d32/4ceb223f/videos/002/044/287/2044287.flv?r=150");


    wie koennte ich es jetzt verwirklichen das autoit immer nur den string http://beispiel.link.com/dl/135a8b155f2…287/2044287.flv der flv ausliest?

    Ich hatte mir schon ueberlegt das ich dafuer den script nach dem begriff video_url durchsuchen muesste und dann irgendwie das kopieren was da nach steht. Aber so ganz blicke ich da noch nicht durch :D

    danke fuer eure hilfe

    clonker

    2 Mal editiert, zuletzt von clonker (23. November 2010 um 04:38)

  • [autoit]

    #include <array.au3>
    #include <string.au3>
    $sString = 'to.addVariable("video_url","http://beispiel.link.com/dl/135a8b155f246d11adc29069fdbb4d32/4ceb223f/videos/002/044/287/2044287.flv?r=150");'
    $aResult = _StringBetween($sString, '"video_url","', '?')
    _ArrayDisplay($aResult)
    ;oder
    $aResult = StringRegExp($sstring, '"video_url","(.*?)\?', 1, 1)
    _ArrayDisplay($aResult)
    ;oder
    $aResult = StringRegExp($sstring, '(http://.*?flv)', 1, 1)
    _ArrayDisplay($aResult)

    [/autoit][autoit][/autoit][autoit]

    #cs ### Output ###
    [0] http://beispiel.link.com/dl/135a8b155f2…287/2044287.flv
    #ce

    [/autoit]
  • hey,
    danke schonmal ;) klappt super ;)
    Wie kann ich diesen teil direkt aus der html auslesen ? weil diese stelle habe ich ja nicht als string so wie in deinem beispiel sondern sie ist nur eine stelle in dem html source der website :/

    lG

    clonker

  • [autoit]

    _IEDocReadHTML

    [/autoit]


    oder besser

    [autoit]

    _IEBodyReadHTML

    [/autoit]

    in der AutoIt Hilfe findest du auch ein Beispiel dazu!

    [Edit]
    zu langsam... :(