Hallo,
Ich möchte meine über 1.400 angesammelte Serverlog-Dateien (.txt von den letzten 4 Jahren) auswerten bzw. mit Hilfe von Tabellenkalkulation weiterbearbeiten und eine Statistik über bestimmte Einträge erstellen. Vorab ist aber ein großes Problem zu lösen, dass in ca. 2/3 der Dateien - Servereinträge -, also Zeilen enthalten sind, welche nicht mit ausgewertet werden dürfen. Dabei handelt es sich um andere Domains und Subdomains, die nicht zu meinem Auswertungsziel gehören.
Was möchte ich:
- Recursiv ein Verzeichnis einlesen mit allen Unterverzeichnissen und deren (.txt) Dateien mittels _FileListToArrayRec (ich hoffe dass das richtig ist)
- In den .txt und .log Dateien nach Zeilen Suchen die mit "http://top-" beginnen und alle mit ".exe" und "bat" und "php" und "html" enden, entfernen. Das Problem ist also, dass ich die Such-Strings nicht mit einem gewöhnlichen StringReplace ersetzen kann, weil der Inhalt ja immer zwischen "http://top-" und ".exe" und "bat" und "php" und "html" unterschiedliche Inhalte hat. Auch die Zeilennummern sind bei diesen Serverlogs immer unterschiedlich.
; Das hier würde zum Beispiel nicht funktionieren weil der Text "undderInhaltistimmerunterschiedlich" variiert.
$file = fileopen("Log1.txt",2)
$file2 = StringReplace($file,"http://undderInhaltistimmerunterschiedlich","")
filewrite("Log000001.txt",$file2)
Ich hoffe Ihr könnt verstehen was ich meine.
Es wäre klasse, wenn mit bitte jemand bei einer Lösung helfen könnte. Ich weiß nicht wirklich, wie es sinnvoll zu lösen wäre.