Text nach Links untersuchen

  • Hi,
    ich würde gerne ein Programm schreiben was die Fähigkeit besitzt aus einem Text in dem Links in unterschiedlichen Zeilen verborgen sind, herauszunehmen und es dann in eine extra Textdatei speichert.
    Mein Problem bei der ganzen Sache ist, dass mehrere Links in unterschiedlichen Zeilen sind und die Links sind natürlich auch alle unterschiedlich lang, das könnte zum Beispiel so aussehen:

    Code
    ---------------------------------------------------------------------------------------------------------------------------------------------------------
    xxxxxxxxxxxx http://homepagename.com/ordner/xxxx.kürzel1
    xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxx
    xxxxxxxxxxxxxxx http://homepagename.com/ordner/ordner/ordner/xxxxxxxxx.kürzel2&xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
    xxxxxxx http://homepagename.com/ordner/ordner/xxxxxxx.kürzel2 xxxxxxxxxxxx
    xxxxxxxxxxxxxxxxxxxxxxx http://homepagename.com/ordner/xxxxxxxx.kürzel1
    ---------------------------------------------------------------------------------------------------------------------------------------------------------

    Diese Datei ist anschließend im txt format gespeichert und kann unterschiedlich lang sein und so wird es halt sehr langwierig das per Hand alles aus zu sortieren.
    Im Prinzip was immer gleichbleibt ist das Kürzel also in dem Fall möchte ich nur .kürzel1 haben und das http:// ist immer gleichbleibend. Es kann auch passieren das nach dem Kürzel kein Abstand kommt bevor der Text wieder anfängt.
    Bei diesem Link (http://homepagename.com/ordner/xxxx.kürzel1) muss quasi von http:// bis einschließlich .kürzel1 makiert und kopiert werden und in eine extra Textdatei gespeichert werden.

    Die gewünschte Textdatei nach dem Beispiel von oben sollte dann so aussehen:

    Code
    ---------------------------------------------------------------------------------------------------------------------------------------------------------
    http://homepagename.com/ordner/xxxx.kürzel1
    http://homepagename.com/ordner/xxxxxxxx.kürzel1
    ---------------------------------------------------------------------------------------------------------------------------------------------------------

    Hat einer vielleicht jemand irgend eine Möglichkeit wie ich von AutoIt den Text so durchstöbern lassen kann, dass ich dann nur noch die Links erhalte mit .kürzel1

    Danke schonmal für eure Ideen.

    Einmal editiert, zuletzt von GreenRanger (9. Februar 2009 um 16:23)

  • Spoiler anzeigen
    [autoit]


    #include <File.au3>
    #include <String.au3>
    Dim $quell
    _FileReadToArray("quell.txt", $quell)
    For $i = 1 To $quell[0]
    $string = _StringBetween($quell[$i], "http://", ".kürzel1")
    If Not IsArray($string) Then

    Else
    FileWriteLine("fertig.txt", "http://" & $string[0] & ".kürzel1" & @CRLF)
    EndIf
    Next

    [/autoit]


    Padmak

  • Wow das ging aber schnell ^^ vielen Dank :)

    Edit:
    Also habs getestet, es funktioniert Prima ich komm mir nur irgendwie blöd vor das ich darauf nicht gekommen bin ^^
    Danke nochmal

    2 Mal editiert, zuletzt von GreenRanger (8. Februar 2009 um 22:10)

  • passt schon
    ich hab hier heute schon fast dieselbe frage gestellt deshalb war ich so schnell :D

    Padmak