- Offizieller Beitrag
Hier mal eine kleine Funktion zum umwandeln der von HTML stammenden "named entities" oder "benannte Zeichen" in Unicode-Zeichen.
Spoiler anzeigen
$sText = 'Käse Äpfel Öl Überfall Füße 450€'
$sText = _HTML_named_entities2Unicode($sText)
ConsoleWrite($sText & @CR)
Func _HTML_named_entities2Unicode($sText)
Local $aHTML_Entities[251][2] = [ _
["Acirc", 194],["acirc", 226],["acute", 180],["AElig", 198],["aelig", 230],["Agrave", 192],["agrave", 224],["alefsym", 8501], _
["Alpha", 913],["alpha", 945],["amp", 38],["and", 8743],["ang", 8736],["apos", 39],["Aring", 197],["aring", 229], _
["asymp", 8776],["Atilde", 195],["atilde", 227],["Auml", 196],["auml", 228],["bdquo", 8222],["Beta", 914],["beta", 946], _
["brvbar", 166],["bull", 8226],["cap", 8745],["Ccedil", 199],["ccedil", 231],["cedil", 184],["cent", 162],["Chi", 935], _
["chi", 967],["circ", 710],["clubs", 9827],["cong", 8773],["copy", 169],["crarr", 8629],["cup", 8746],["curren", 164], _
["Dagger", 8225],["dagger", 8224],["dArr", 8659],["darr", 8595],["deg", 176],["Delta", 916],["delta", 948],["diams", 9830], _
["divide", 247],["Eacute", 201],["eacute", 233],["Ecirc", 202],["ecirc", 234],["Egrave", 200],["egrave", 232],["empty", 8709], _
["emsp", 8195],["ensp", 8194],["Epsilon", 917],["epsilon", 949],["equiv", 8801],["Eta", 919],["eta", 951],["ETH", 208], _
["eth", 240],["Euml", 203],["euml", 235],["euro", 8364],["exist", 8707],["fnof", 402],["forall", 8704],["frac12", 189], _
["frac14", 188],["frac34", 190],["frasl", 8260],["Gamma", 915],["gamma", 947],["ge", 8805],["gt", 62],["hArr", 8660], _
["harr", 8596],["hearts", 9829],["hellip", 8230],["Iacute", 205],["iacute", 237],["Icirc", 206],["icirc", 238],["iexcl", 161], _
["Igrave", 204],["igrave", 236],["image", 8465],["infin", 8734],["int", 8747],["Iota", 921],["iota", 953],["iquest", 191], _
["isin", 8712],["Iuml", 207],["iuml", 239],["Kappa", 922],["kappa", 954],["Lambda", 923],["lambda", 955],["lang", 9001], _
["laquo", 171],["lArr", 8656],["larr", 8592],["lceil", 8968],["ldquo", 8220],["le", 8804],["lfloor", 8970],["lowast", 8727], _
["loz", 9674],["lrm", 8206],["lsaquo", 8249],["lsquo", 8216],["lt", 60],["macr", 175],["mdash", 8212],["micro", 181], _
["middot", 183],["minus", 8722],["Mu", 924],["mu", 956],["nabla", 8711],["nbsp", 160],["ndash", 8211],["ne", 8800], _
["ni", 8715],["not", 172],["notin", 8713],["nsub", 8836],["Ntilde", 209],["ntilde", 241],["Nu", 925],["nu", 957], _
["Oacute", 211],["oacute", 243],["Ocirc", 212],["ocirc", 244],["OElig", 338],["oelig", 339],["Ograve", 210],["ograve", 242], _
["oline", 8254],["Omega", 937],["omega", 969],["Omicron", 927],["omicron", 959],["oplus", 8853],["or", 8744],["ordf", 170], _
["ordm", 186],["Oslash", 216],["oslash", 248],["Otilde", 213],["otilde", 245],["otimes", 8855],["Ouml", 214],["ouml", 246], _
["para", 182],["part", 8706],["permil", 8240],["perp", 8869],["Phi", 934],["phi", 966],["Pi", 928],["pi", 960], _
["piv", 982],["plusmn", 177],["pound", 163],["Prime", 8243],["prime", 8242],["prod", 8719],["prop", 8733],["Psi", 936], _
["psi", 968],["quot", 34],["radic", 8730],["rang", 9002],["raquo", 187],["rArr", 8658],["rarr", 8594],["rceil", 8969], _
["rdquo", 8221],["real", 8476],["reg", 174],["rfloor", 8971],["Rho", 929],["rho", 961],["rlm", 8207],["rsaquo", 8250], _
["rsquo", 8217],["sbquo", 8218],["Scaron", 352],["scaron", 353],["sdot", 8901],["sect", 167],["shy", 173],["Sigma", 931], _
["sigma", 963],["sigmaf", 962],["sim", 8764],["spades", 9824],["sub", 8834],["sube", 8838],["sum", 8721],["sup", 8835], _
["sup1", 185],["sup2", 178],["sup3", 179],["supe", 8839],["szlig", 223],["Tau", 932],["tau", 964],["there4", 8756], _
["Theta", 920],["theta", 952],["thetasym", 977],["thinsp", 8201],["THORN", 222],["thorn", 254],["tilde", 732],["times", 215], _
["trade", 8482],["Uacute", 218],["uacute", 250],["uArr", 8657],["uarr", 8593],["Ucirc", 219],["ucirc", 251],["Ugrave", 217], _
["ugrave", 249],["uml", 168],["upsih", 978],["Upsilon", 933],["upsilon", 965],["Uuml", 220],["uuml", 252],["weierp", 8472], _
["Xi", 926],["xi", 958],["Yacute", 221],["yacute", 253],["yen", 165],["Yuml", 376],["yuml", 255],["Zeta", 918], _
["zeta", 950],["zwj", 8205],["zwnj", 8204]]
For $i = 0 To UBound($aHTML_Entities) - 1
$sText = StringReplace($sText, '&' & $aHTML_Entities[$i][0] & ';', ChrW($aHTML_Entities[$i][1]), 0, 1)
Next
Return $sText
EndFunc ;==>_HTML_named_entities2Unicode
Edit: Den Tip von AspirinJunkie umgesetzt. Danke!