StringRegExp Zeilenumbrüche

Spion

Hallo,

Habe ein Problem mit StringRegExp und Zeilenumbrüchen. Normaleweise lösche ich vorher immer alle Zeilenumbrüche aber mit diesem Trick komme ich jetzt nicht weiter weil sonst zwei Zahlen zusammenrutschen und die eine Zahl brauche ich.

Hier der Ausgangscode:

Spoiler anzeigen

Code

2047:
  activities:
    copying:
      time: 720
    invention:
      materials:
      - quantity: 2
        typeID: 20416
      - quantity: 2
        typeID: 20415
      products:
      - probability: 0.34
        quantity: 10
        typeID: 2049
      skills:
      - level: 1
        typeID: 11529
      - level: 1
        typeID: 11442
      - level: 1
        typeID: 23121
      time: 13800
    manufacturing:
      materials:
      - quantity: 1062
        typeID: 34
      - quantity: 2
        typeID: 35
      - quantity: 53
        typeID: 36
      products:
      - quantity: 1
        typeID: 2046
      skills:
      - level: 1
        typeID: 3380
      time: 900
    research_material:
      time: 315
    research_time:
      time: 315
  blueprintTypeID: 2047
  maxProductionLimit: 200
2049:
  activities:
    copying:
      materials:
      - quantity: 1
        typeID: 11465
      - quantity: 15
        typeID: 3812
      skills:
      - level: 1
        typeID: 11442
      - level: 1
        typeID: 11529
      time: 1872
    manufacturing:
      materials:
      - quantity: 1
        typeID: 11553
      - quantity: 1
        typeID: 11399
      - quantity: 5
        typeID: 3689
      - quantity: 1
        typeID: 11695
      - quantity: 1
        typeID: 11475
      - quantity: 3
        typeID: 3828
      - quantity: 1
        typeID: 11542
      - quantity: 1
        typeID: 11540
      - quantity: 1
        typeID: 2046
      products:
      - quantity: 1
        typeID: 2048
      skills:
      - level: 5
        typeID: 3380
      - level: 1
        typeID: 11442
      - level: 1
        typeID: 11529
      time: 2340
    research_material:
      materials:
      - quantity: 1
        typeID: 11465
      - quantity: 2
        typeID: 9836
      - quantity: 4
        typeID: 3814
      skills:
      - level: 5
        typeID: 3409
      - level: 1
        typeID: 11442
      - level: 1
        typeID: 11529
      time: 819
    research_time:
      materials:
      - quantity: 1
        typeID: 11465
      - quantity: 2
        typeID: 9836
      - quantity: 4
        typeID: 3814
      skills:
      - level: 5
        typeID: 3403
      - level: 1
        typeID: 11442
      - level: 1
        typeID: 11529
      time: 819
  blueprintTypeID: 2049
  maxProductionLimit: 10
2118:
  activities:
    copying:
      materials:
      - quantity: 1
        typeID: 11466
      - quantity: 25
        typeID: 3812
      skills:
      - level: 1
        typeID: 11448
      - level: 1
        typeID: 11453
      time: 3744
    manufacturing:
      materials:
      - quantity: 3
        typeID: 11536
      - quantity: 1
        typeID: 580
      - quantity: 6
        typeID: 11399
      - quantity: 3
        typeID: 11534
      - quantity: 3
        typeID: 11535
      - quantity: 8
        typeID: 9840
      - quantity: 3
        typeID: 11537
      - quantity: 9
        typeID: 9842
      - quantity: 5
        typeID: 11541
      - quantity: 1
        typeID: 11483
      products:
      - quantity: 1
        typeID: 2117
      skills:
      - level: 5
        typeID: 3380
      - level: 1
        typeID: 11448
      - level: 1
        typeID: 11453
      time: 4680
    research_material:
      materials:
      - quantity: 1
        typeID: 11466
      - quantity: 3
        typeID: 9836
      - quantity: 5
        typeID: 3814
      skills:
      - level: 5
        typeID: 3409
      - level: 1
        typeID: 11448
      - level: 1
        typeID: 11453
      time: 1638
    research_time:
      materials:
      - quantity: 1
        typeID: 11466
      - quantity: 3
        typeID: 9836
      - quantity: 5
        typeID: 3814
      skills:
      - level: 5
        typeID: 3403
      - level: 1
        typeID: 11448
      - level: 1
        typeID: 11453
      time: 1638
  blueprintTypeID: 2118
  maxProductionLimit: 10

Alles anzeigen

Aus diesem will ich die "2049" (Zeile 44) haben. Gebeben ist mir "typeID: 2048" (Zeile 80)

(.*):\s*.*activities:\s*.*typeID: 2048 funktioniert nicht wahrscheinlich wegen dem \s*.*
Was muß ich da schreiben das er alle Zeichen und Zeilenumbrüche nimmt bis typeID: 2048

Gruß
Steffen

**Andy**

Probiers mal mit

//EDIT
Mit Regex hat´s nicht hingehauen wegen fehlendem Skill, daher "zu Fuß"

[autoit]

#include <Array.au3>
$a=fileread("Test_ID.txt")

[/autoit][autoit][/autoit][autoit]

$Suchstring="typeID: 2048"

[/autoit][autoit][/autoit][autoit]

$rep=StringRegExpReplace($a,'(?isU)\b(\d+:)',chr(255) & @crlf&'$0') ;splitten
$split=stringsplit($rep,chr(255),3)

[/autoit][autoit][/autoit][autoit]

$ret=""
for $i in $split
if stringinstr($i,$Suchstring) then ;wenn treffer
$t=stringsplit($i,@crlf,3)
$ret=$t[1] ;erster String
endif
next

[/autoit][autoit][/autoit][autoit]

msgbox(0,0,$ret)

[/autoit]

**AspirinJunkie**

Zitat von Spion

Aus diesem will ich die "2049" (Zeile 44) haben. Gebeben ist mir "typeID: 2048" (Zeile 80)
[...]
Was muß ich da schreiben das er alle Zeichen und Zeilenumbrüche nimmt bis typeID: 2048

Habe ich das richtig verstanden, dass du von Zeile 45 bis 79 alles haben willst?
Falls ich das richtig verstanden habe:

Code

(?s)\N\d+:((?:(?!\N\d+:).)+?)typeID: 2048

Spion

Vielen Dank für eure schnellen Antworten.

@AspirinJunkie

Sorry da habe ich mich falsch ausgedrückt.

stringregexp soll die Zahl 2049 (Zeile 44) ausgeben. Was ich habe ist 2048 (Zeile 80)

@andi

Deine Lösung sieht vielversprechend aus, vielen Dank.
Aber er gibt die 2047 (Zeile 1) aus und nicht die 2049 (Zeile 44)

Was mir jetzt auch aufgefallen ist, das ich wohl das falsche Tool zum testen nehme. Habe es immer hiermit gemacht: http://rubular.com/
Aber Rubular gibt nur einen Fehler zurück. Darum habe ich mir eben Regexbuddy gekauft und so eingestellt (PCRE Engine usw) wie es hier im Tutorial beschrieben ist. Aber auch hier bekomme ich mit: (?is)\b(\d+:).*(?:typeID: 2048) kein Ergebnis. Nur Autoit selbst gibt 2047 aus.

Gruß
Steffen

**AspirinJunkie**

Zitat von Spion

stringregexp soll die Zahl 2049 (Zeile 44) ausgeben. Was ich habe ist 2048 (Zeile 80)

Na dann musst du doch nur die Klammer versetzen:

Code

(?s)(\N\d+):(?:(?!\N\d+:).)+?typeID: 2048

Spion

Vielen Dank euch beiden.

Beide Lösungen funktionieren Super.

[autoit]

$a=fileread("Test_ID.txt")

[/autoit][autoit][/autoit][autoit]

$gegeben = 2048 ; Zeile 80

[/autoit][autoit][/autoit][autoit]

$ergebnis = StringRegExp($a,'(?s)(\N\d+):(?:(?!\N\d+:).)+?typeID: ' & $gegeben,3)
$ergebnis = $ergebnis[0]
msgbox(0,0,$ergebnis) ; gewünschtes Ergebnis 2049 aus Zeile 44

[/autoit]

Gruß
Steffen

**Andy**

Mit dem RegEx und negativem Lookahead war ich mittlerweile auch dabei, es wird langsam!
Aber AspirinJunkie war mal wieder schneller

Ich hatte statt \N aber \b und auch "greedy" gesucht statt wie AspirinJunkie "lazy".
Da negativer Lookahead doch sowieso die in dieser Gruppe enthaltenen Pattern NIEMALS treffen soll?!

@steffen
ich benutze online https://regex101.com
der erklärt immer so schön^^

**AspirinJunkie**

Zitat von Andy

Ich hatte statt \N aber \b

Was definitiv besser wäre.
Das ist ein Fehler in meinem Pattern. Ich wollte eigentlich ausnutzen, dass das Suchpattern immer an einem Zeilenanfang beginnt und hatte (warum auch immer) \N statt ^ verwendet.
Korrigiert würde das ganze dann so aussehen:

Code

(?ms)^(\d+):(?:(?!^\d+:).)+?typeID: 2048

Zitat von Andy

Ich hatte [...] "greedy" gesucht statt wie AspirinJunkie "lazy".
Da negativer Lookahead doch sowieso die in dieser Gruppe enthaltenen Pattern NIEMALS treffen soll?!

Ich wollte den Rechner aber ein bisschen entlasten.
Ich dachte mir: Warum soll ich ihn unnötigerweise weiter suchen lassen als nötig?
Wenn ich das greedy geschrieben hätte, hätte er mit seinem Check nicht gleich bei Zeile 80 aufgehört zu suchen sondern hätte weiter gesucht ob nicht doch vielleicht noch ein typeId: 2048 später auftaucht. Erst in Zeile 123 müsste er diese Hoffnung begraben.

Vom Ergebnis macht das also in diesem Beispiel keinen Unterschied - hingegen aber in der Laufzeit:

Spoiler anzeigen

[autoit]

Global $N = 2500

[/autoit] [autoit][/autoit] [autoit]

Global $s_String = ClipGet()
Global $a_RegEx

[/autoit] [autoit][/autoit] [autoit]

$iT = TimerInit()
For $i = 1 To $N
$a_RegEx = StringRegExp($s_String, "(?ms)^(\d+):(?:(?!^\d+:).)+typeID: 2048", 3)
Next
ConsoleWrite(StringFormat("% 20s: %8.4f ms\tErgebnis: %4d\n", "Greedy", TimerDiff($iT) / $N, $a_RegEx[0]))

[/autoit] [autoit][/autoit] [autoit]

$iT = TimerInit()
For $i = 1 To $N
$a_RegEx = StringRegExp($s_String, "(?ms)^(\d+):(?:(?!^\d+:).)+?typeID: 2048", 3)
Next
ConsoleWrite(StringFormat("% 20s: %8.4f ms\tErgebnis: %4d\n", "Lazy", TimerDiff($iT) / $N, $a_RegEx[0]))

[/autoit]

**Andy**

Ja, das Problem mit der Zeit hatte ich ich während der Entwicklung (im Onlinetool) recht oft.
Wenn dort nach 2 Sekunden kein Treffer erfolgt, wird abgebrochen.

Zitat von AspirinJunkie

Ich dachte mir: Warum soll ich ihn unnötigerweise weiter suchen lassen als nötig?

Ich dachte mir: Sackzement, nach 4h rumprobieren und Dokus lesen hat´s endlich funktioniert!