Liebe Gemeinde,
ich habe Webseiten, aus denen ich ein paar Daten holen soll. Irgendwo darin steht z.B. das:
<tr>
<th>Hausanschrift</th>
<td>
Hausplatz 1<br />
12345 Stadt
</td>
Die Zeilen sind mit Leerzeichen eingerückt.
Ich würde gerne Hausplatz 1 in einen String bekommen und 12345 Stadt in einen anderen. Den Rest brauche ich nicht.
Bei http://www.regexr.com/ habe ich schon ein wenig eingekreist, aber ich bleibe hängen, weil nach Hausplatz 1 noch die PLZ und Teile von der Stadt gefunden werden.
Der Suchstring schaut so aus:
[^<th>Hausanschrift</th>\r\s*<td>\r\*]\w*\s\d*[^<br\s\/>\r\s*]
Ich würde mir wünschen, daß alles rechts nach dem <br /> ignoriert wird. Kann mir da jemand bitte helfen?
Danke!