Als ziemlicher Programmier-Laie bitte ich euch um Hilfe.
Ich bin blutiger Auto-It Anfänger (habe zuletzt vor vielen Jahren mit QBasic herumgebastelt, aber fast alles vergessen...), und möchte mich nun wieder einarbeiten.
Ich möchte Auto-It dazu verwenden (zumindest erscheint es mir dafür am geeignetsten), eine größere Anzahl hmtl-Dateien zu bearbeiten, konkret: Lange Textpassagen darin zu kürzen. Also sozusagen den eigentlichen Quellcode unverändert lassen, aus den Texten aber "Teaser" zu machen.
In der Boardsuche habe ich leider nichts Passendes gefunden (da werden allenfalls die Suchergebnisse verändert, nicht etwas zwischen zwei Suchstellen).
Diese Textpassagen, von denen es pro Datei durchaus 100 oder mehr geben kann, stehen in zwei Rubriken, die über Suchbegriffe eindeutig erkannt werden können. Auch Beginn und Ende der Textpassagen können über eindeutige Zeichenketten erkannt werden, nur die Texte selbst sind natürlich stets andere.
Ich stelle mir das so vor:
1 Öffne erste Datei im Verzeichnis "Original"
2 Suche darin ersten Rubrik (Beginn erkennbar durch Text "aaaaaaa")
3 Suche darin nach Textstelle zwischen zwei Suchkriterien (z.B. Link-Ende und nächstem festen Umbruch)
(_StringBetween? Wenn ich das richtig verstehe, schreibt _StringBetween einen Array mit allen Fundstellen, dann kann man vielleicht 4 + 5 direkt auf den Array anwenden und die Schleife mit der Suche in der Datei sparen?)
4 Kürze die Textstelle auf die 200 ersten Zeichen, füge "(...)" hinzu, ersetzte Originaltextstelle damit (StringReplace?)
5 Solange nicht Ende der Rubrik mit "bbbbbbb" erreicht, suche weiter in der Datei. d.h. wiederhole ab 3
6 Suche zweite Rubrik (Beginn erkennbar durch Text "ccccccc")
(analog weiter wie 3 bis 5, bis "ddddddd")
7 Speichere veränderte Datei im Verzeichnis "Kopie"
8 Wiederhole 1 bis 7 für alle Dateien im Verzeichnis "Original"
Ich glaube ja, dass das nur einige wenige Code-Zeilen sind, aber ich kann nirgends eine Vorlage finden, die ich passend abändern kann. Und selbst den Code zu schreiben traue ich mir noch nicht zu (habs kürzlich mal versucht und bin mit Fehlermeldungen überschüttet worden, ohne dass ich verstanden habe, wo das Problem lag )
Die "aaaaaa" usw. kann ich dann durch die tatsächlichen Suchkriterien ersetzen.
Wahrscheinlich wäre es am einfachsten, die ganze Datei als einen einzigen langen String zu laden und zu manipulieren? Allerdings haben die Dateien Größen bis zu 500 kb; ich weiß nicht einmal, ob so lange Strings überhaupt möglich oder manipulierbar sind.
Als Beispiel für die Dateien könnt ihr eine beliebige Google-News-Seite nehmen (nein, ich will nicht Google-News verarbeiten, die Texte dort sind ja auch schon gekürzt, aber die Struktur ist recht ähnlich. Die Dateien, die ich bearbeiten möchte, stammen nicht aus fremder Quelle!). Unten ein GN-Textauszug, im Original sind Links und andere Formatierungen drin, die auch hier die eindeutige Erkennung der Textbereiche ermöglichen, in diesem Plain-Text-Beispiel wäre es zwischen "Minuten gefunden" und "...":
------------------
Knut und Co.: Wieviel Eisbär ist erlaubt?
Philibuster - vor 8 Minuten gefunden
Eisbär Knut ist gestorben und konkurriert nun mit Japan und Libyen um die Top-Schlagzeilen. Schlimm ist das eigentlich nicht, sondern eher Anlass, ...
Gedenken: Porzellanfiguren von Knut zu gewinnen
Berliner Morgenpost - vor 1 Stunde gefunden
Schon kurz nach seiner Geburt wurde Knut zum Berliner Wahrzeichen. Dies nahm auch die Königliche Porzellan-Manufaktur in Berlin zum Anlass, Knut eine ...
Rätselraten in Berlin: Woran starb Knut?
STERN.DE - vor 20 Stunden gefunden
Pathologen untersuchen nun den Tod des Eisbären Knut. Doch bis zum Montagabend blieben die Untersuchungen ohne konkretes Ergebnis. ...
----------------
Es wäre großartig, wenn mir dabei jemand helfen könnte.
Freue mich darauf, mit Hilfe dieses ersten kleinen Skripts Auto-It zu erlernen und das Skipt dann noch weiter auszubauen.
Vielen Dank!