Hi Leute,
da ich öfter mal Texte von Internetseiten auslese und mir die Sonderzeichen immer etwas anders dargestellt wurden (UTF8 & HTML) habe ich 2 Scripte geschrieben um diese in "normale" Zeichen umzuwandeln. Weitere HTML-Codes wie zb. <b> oder font-style: lösche ich mit HTML2 heraus. Diese Datei ist übrigens noch ausbaufähig! Es löscht zwar schon das meiste heraus, aber noch nicht alles und oft bleiben einzelne > übrig. Das letze (Symbols) ist dazu da für einen Dateinamen die ungültigen Zeichen herauszulöschen, also nichts soo besonderes.
Ich würde mich über ein kleines Feedback & ggf. Verbesserungsvorschläge freuen.
Aquaplant
/Edit Anfang Feb '11: Kleines Update der HTML 2 Version und habe eine schnellere Alternative mit reingestellt (ist allerdings noch "Beta")