SciTE - Neue AU3-Datei immer mit Kodierung "UTF-8 mit BOM" erstellen

**BugFix**

Es kann sein, dass das Thema mit der neuesten Version von SciTE gar nicht mehr aktuell ist.
Ich benutze noch die Version 3.4.4 - und in dieser ist keine Möglichkeit per Voreinstellung Dateien immer mit Kodierung "UTF8+BOM" zu erstellen.

Das läßt sich mit einem Lua-Skript beheben.

EDIT 2021-04-15

Da ich nicht nur AutoIt-Skript in SciTE bearbeite/erstelle, fand ich es nun lästig immer das BOM, wenn nicht erforderlich, zu entfernen.

Darum hier eine neue Version, die ausschliesslich au3-Dateien (Standard) und ggf. per Property festlegbare weiter Dateitypen mit dem BOM versieht.

Falls ihr die "new_as_utf8bom.lua" in der SciTEStartup.lua eingetragen habt, einfach mit der "CheckBOM.lua" ersetzen.

Code: CheckBOM.lua

-- TIME_STAMP   2021-04-15 14:02:19


--[[
After a file was saved, the event OnSave will fired.
Now will checked:
- needs this file typ the BOM?
- If Yes: Has this file already the BOM?
-          If No: Write the BOM sequence at the beginning of the file


If you want register other types as "au3" for set BOM use this property in SciTEUser.properties:

#~ File types, that needs byte order mark
#~ "au3" is predefined and does not need to be set here
BOM.File.Types=extension_1 extension_2
]]


CheckBOM = EventClass:new(Common)

CheckBOM.OnSave = function(self, _file)
    if not self:NeedsBOM(props['FileExt']) then return nil end
    if not self:StartsWithBOM(_file) then scite.MenuCommand(153) end
    return nil
end

CheckBOM.StartsWithBOM = function(self, _file)
    local ToHex = function(_s)
        if _s == nil then return "DEAD" end
        return (_s:gsub('.', function(_c) return ('%02X'):format(_c:byte()) end))
    end
    local fh = io.open(_file, "rb")
    local read = fh:read(3)
    fh:close()
    return (ToHex(read) == "EFBBBF")
end

CheckBOM.NeedsBOM = function(self, _ext)
    local extensions = props['BOM.File.Types']:lower()..' au3'
    if extensions:find(_ext:lower()) then return true else return false end
end

Alles anzeigen

Code

-- TIME_STAMP   2017-05-26 11:19:55


NewFile = EventClass:new(Common)


function NewFile:OnUpdateUI(filename)
    if props["FileName"] == "" then
        -- set to UTF-8 with BOM
        scite.MenuCommand(153) -- 153 = IDM_ENCODING_UTF8
    end
    return nil  -- default processing
end

Alles anzeigen

Als new_as_utf8bom.lua abspeichern und im Lua-Startup-Skript mit LoadLuaFile("new_as_utf8bom.lua", "..PFAD\\mit\\abschliessendem\\Doppelbackslash\\") eintragen.
Nach Neustart von SciTE, wird jede neue Datei als UTF8+BOM kodiert.

EDIT:
Dasselbe Problem besteht bei Erstellen einer au3-Datei über das Kontextmenü des Explorers.
Lösung
- Editor (SciTE oder NPP) als Administrator starten
- Datei öffnen: C:\Windows\ShellNew\Template.au3
- Kodierung ändern zu "UTF-8 mit BOM"
- Datei abspeichern (nochmal prüfen ob Kodierung auch übernommen wurde)

Jetzt werden auch über das Kontextmenü erstellte Dateien in der UTF-8+BOM Kodierung erzeugt.

EDIT2: PERSONAILISIERTES TEMPLATE
Mit dem folgenden Skript wird die Template-Datei personalisiert erstellt.
Die AutoItversion wird ausgelesen und im Template verwendet. (bisher fix)
Der User-Name wird aus der Property "UDFCreator" ausgelesen. Ist dort kein Wert gesetzt, wird der PC-Username verwendet.
Das Standard-Template wird dann überschrieben.

Wer mag, kann natürlich den Inhalt des Templates noch weiter nach eigenem Geschmack gestalten.
Dann einfach das Skript starten - fertig.

AutoIt

;-- TIME_STAMP   2017-05-27 13:57:52   v 0.1


#RequireAdmin


_FileCreateTemplate()




Func _FileCreateTemplate()
    Local $sCreator = _GetAU3Property('UDFCreator', @UserName)
    Local $sWrite = _
    "#cs ----------------------------------------------------------------------------" & @CRLF & @CRLF & _
    " AutoIt Version:  " & @AutoItVersion & @CRLF & _
    " Author:          " & ($sCreator = "Your Name" ? @UserName : $sCreator) & @CRLF & @CRLF & _
    " Script Function: AutoIt script." & @CRLF & @CRLF & _
    "#ce ----------------------------------------------------------------------------" & @CRLF & @CRLF & _
    "; Script Start - Add your code below here" & @CRLF
    Local $sFileName = @WindowsDir & "\ShellNew\Template.au3"
    If Not FileExists($sFileName) Then Exit MsgBox(262192, 'Fehler', 'Es ist keine Datei "Template.au3" installiert!')
    Local $fH = FileOpen($sFileName, 2+128)
    Local $iSucc = FileWrite($fH, $sWrite)
    FileClose($fH)
    Exit MsgBox(($iSucc = 1 ? 262208 : 262192), ($iSucc = 1 ? 'Fertig!' : 'Fehler!'), ($iSucc = 1 ? _
        'Das personalisierte Template wurde erfolgreich geschrieben.' : 'Das Template konnte nicht geschrieben werden.'))
EndFunc




; #FUNCTION# ====================================================================================================================
; Name ..........: _GetAU3Property
; Description ...: Gets a property value (one-line entry only!). Ask order: 1. SciTEUser.properties 2. au3.properties
; Syntax ........: _GetAU3Property($sProperty[, $sDefault = ''])
; Parameters ....: $sProperty           - The property name
;                  $sDefault            - [optional] A value to use, if none property set. Default is ''.
; Return values .: The value of the property (or the default value)
; Author ........: BugFix
; ===============================================================================================================================
Func _GetAU3Property($sProperty, $sDefault='')
    Local $sPathUserProp = @LocalAppDataDir & "\AutoIt v3\SciTE\SciTEUser.properties"         ; C:\Users\[USER]\AppData\Local\AutoIt v3\SciTE\SciTEUser.properties
    Local $sPathAU3Prop = StringTrimRight(@AutoItExe, 11) & "SciTE\properties\au3.properties" ; C:\Program Files (x86)\AutoIt3\SciTE\properties\au3.properties
    Local $sRead = '', $sValueReturn = $sDefault, $aMatch
    Local $sPattern = $sProperty & "=([^\r\n]+)"
    If FileExists($sPathUserProp) Then $sRead = FileRead($sPathUserProp)
    $aMatch = StringRegExp($sRead, $sPattern, 1)
    If @error Then
        If FileExists($sPathAU3Prop) Then $sRead = FileRead($sPathAU3Prop)
        $aMatch = StringRegExp($sRead, $sPattern, 1)
        If Not @error Then $sValueReturn = $aMatch[0]
    Else
        $sValueReturn = $aMatch[0]
    EndIf
    Return $sValueReturn
EndFunc

Alles anzeigen

**autoiter**

Hey vielen Dank @BugFix!
Funktioniert und ist noch aktuell. Ich nutze Version 3.7.3.

P.S.
Weißt du vllt. auch eine Möglichkeit, wie man auch über "Explorer-Kontextmenü->Neu->AutoIt v3 Script" Dateien mit UTF8+BOM Kodierung erstellt.

**BugFix**

Zitat von autoiter

Weißt du vllt. auch eine Möglichkeit, wie man auch über "Explorer-Kontextmenü->Neu->AutoIt v3 Script" Dateien mit UTF8+BOM Kodierung erstellt.

Ich habe das bei mir gar nicht aktiviert. Schau mal bitte in der Registry, welches Skript dabei aufgerufen wird. Dann schaue ich mir das mal an.

**autoiter**

Hmm, das kann ich gar nicht sagen.

Bin ich richtig unter "Computer\HKEY_CLASSES_ROOT\.au3\SchellNew"? Da steht Filename Template.au3

**BugFix**

Ja, das ist es - ich gucke mal.

Die Datei habe ich gar nicht, wird wohl nur installiert, wenn man das anwählt. - Stell die bitte mal ein.

**autoiter**

Danke

**autoiter**

Wir sind doch alle faul, sonst wären wir nicht hier unterwegs. Daher habe ich das automatisiert. Das bedeutet natürlich neue Fehlerquellen und hat mich mehr Zeit gekostet als das normale ändern

Edit: Einen Beitrag weiter gehen.

Spoiler anzeigen

AutoIt

#RequireAdmin


$sFilePath = StringReplace(@AutoItExe, 'autoit3.exe', '') & 'SciTE\lua\'
$sNewFilename = 'new_as_utf8bom.lua'
$sStartScript = 'SciTEStartup.lua'
$sNewLine = 'LoadLuaFile("new_as_utf8bom.lua", "' & StringReplace($sFilePath, '\', '\\') & '")'
$sChangeFile = 'C:\Windows\ShellNew\Template.au3'


$sNewFileSting = '-- TIME_STAMP   2017-05-26 11:19:55' & @CRLF & 'NewFile = EventClass:new(Common)' & @CRLF & 'function NewFile:OnUpdateUI(filename)' & @CRLF & _
		'	if props["FileName"] == "" then' & @CRLF & '		-- set to UTF-8 with BOM' & @CRLF & _
		'		scite.MenuCommand(153) -- 153 = IDM_ENCODING_UTF8' & @CRLF & '	end' & @CRLF & '	return nil  -- default processing' & @CRLF & 'end'


If Not FileExists($sFilePath & $sNewFilename) Then FileWrite($sFilePath & $sNewFilename, $sNewFileSting)
If @error Then Exit MsgBox(0, '', 'Fehler beim Schreiben von ' & $sFilePath & $sNewFilename)


$sStartScriptString = FileRead($sFilePath & $sStartScript)
If @error Then Exit MsgBox(0, '', 'Fehler beim Auslesen von ' & $sFilePath & $sStartScript)


$iBackup = FileCopy($sFilePath & $sStartScript, $sFilePath & $sStartScript & '.' & StringFormat('%s%s%s_%s%s%s', @MDAY,@MON,@YEAR,@HOUR,@MIN,@SEC) & '.bac')
If Not $iBackup Then Exit MsgBox(0,'', 'Abbruch wegen Fehler beim Erstellen des Backup von ' & $sFilePath & $sStartScript)


If Not StringInStr($sStartScriptString, $sNewLine) Then
	$hFileOpen = FileOpen($sFilePath & $sStartScript, 2)
	If $hFileOpen = -1 Then Exit MsgBox(0, '', $sFilePath & $sStartScript & ' konnte nicht geöffnet werden')
	$aSplit = StringSplit($sStartScriptString, 'if os.getenv', 3)
	FileWrite($hFileOpen, $aSplit[0] & $sNewLine & @CRLF & 'if os.getenv' & $aSplit[1])
	FileClose($hFileOpen)
EndIf


$sString = FileRead($sChangeFile)
If @error Then Exit MsgBox(0, '', 'Fehler beim Löschen von ' & $sChangeFile)
$hFileOpen = FileOpen($sChangeFile, 130)
FileWrite($hFileOpen, $sString)
FileClose($hFileOpen)


MsgBox(0, '', 'Neue Skripte werden nun direkt mit UTF8+BOM Zeichensatz erstellt', 4)

Alles anzeigen

**Bitnugger**

@autoiter
Ich war so frei und habe ein paar Korrekturen/Änderungen an deinem Script vorgenommen... damit es auch bei mir läuft.

AutoIt

;-- TIME_STAMP   2017-05-27 03:24:44   v 0.1


#RequireAdmin


_Do_UTF8_BOM()


Func _Do_UTF8_BOM()
	Local $aFilePath, $sUserFilePath, $sFilePath, $sNewFilename, $sStartScript, $sNewLine, $sChangeFile, $sNewFileString, $sStartScriptString, $iBackup, $hFile, $aSplit, $sString


	$sFilePath = RegRead("HKEY_LOCAL_MACHINE\SOFTWARE" & ((@AutoItX64 = 1) ? "\Wow6432Node" : "") & "\AutoIt v3\AutoIt", "InstallDir") & '\SciTE\lua\'


	$aFilePath = StringRegExp(FileRead(EnvGet('SCITE_USERHOME') & '\SciTEUser.properties'), 'Lua.User.Scripts.Path=.+', 1)
	If IsArray($aFilePath) Then
		$sUserFilePath = StringSplit($aFilePath[0], '=', 2)[1] & '\'
	Else
		$sUserFilePath = $sFilePath
	EndIf


	$sStartScript = 'SciTEStartup.lua'
	$sNewFilename = 'new_as_utf8bom.lua'


	$sStartScriptString = FileRead($sFilePath & $sStartScript)
	If @error Then Exit MsgBox(0, '', 'Abbruch - Fehler beim Einlesen: ' & $sFilePath & $sStartScript)


	$sNewLine = (StringInStr($sStartScriptString, 'LoadUserLuaFile') > 0) ? 'LoadUserLuaFile("new_as_utf8bom.lua")' : 'LoadLuaFile("new_as_utf8bom.lua", "' & StringReplace($sFilePath, '\', '\\') & '")'
	$sChangeFile = 'C:\Windows\ShellNew\Template.au3'


	$sNewFileString = '-- TIME_STAMP   2017-05-27 01:38:27 \' & _
			  'NewFile = EventClass:new(Common) \' & _
			  'function NewFile:OnUpdateUI(filename) \' & _
			  '	   if props["FileName"] == "" then \' & _
			  '	   	   -- set to UTF-8 with BOM \' & _
			  '	   	   scite.MenuCommand(153) -- 153 = IDM_ENCODING_UTF8 \' & _
			  '	   end \' & _
			  '	   return nil  -- default processing \' & _
			  'end'


	FileWrite($sUserFilePath & $sNewFilename, StringReplace($sNewFileString, ' \', @CRLF))
	If @error Then Exit MsgBox(0, '', 'Abbruch - Fehler beim Schreiben: ' & $sUserFilePath & $sNewFilename)




	$iBackup = FileCopy($sFilePath & $sStartScript, $sFilePath & $sStartScript & '.' & StringFormat('%s%s%s_%s%s%s', @MDAY, @MON, @YEAR, @HOUR, @MIN, @SEC) & '.bak')
	If Not $iBackup Then Exit MsgBox(0, '', 'Abbruch - Fehler beim Erstellen des Backups: ' & $sFilePath & $sStartScript)


	If Not StringInStr($sStartScriptString, $sNewLine) Then
		$hFile = FileOpen($sFilePath & $sStartScript, 2)
		If $hFile = -1 Then Exit MsgBox(0, '', $sFilePath & $sStartScript & ' konnte nicht geöffnet werden')
		$aSplit = StringSplit($sStartScriptString, 'if os.getenv', 3)
		FileWrite($hFile, $aSplit[0] & $sNewLine & @CRLF & 'if os.getenv' & $aSplit[1])
		FileClose($hFile)
	EndIf


	$sString = FileRead($sChangeFile)
	If @error Then Exit MsgBox(0, '', 'Abbruch - Fehler beim Löschen: ' & $sChangeFile)
	$hFile = FileOpen($sChangeFile, 130)
	FileWrite($hFile, StringReplace($sString, 'myName', @UserName))
	FileClose($hFile)


	MsgBox(0, '', 'Neue Skripte werden nun mit UTF8+BOM Zeichensatz erstellt', 4)
EndFunc   ;==>_Do_UTF8_BOM

Alles anzeigen

**autoiter**

Hallo @Bitnugger,
ah, verstehe. Wenigstens habe ich nichts kaputt gemacht.
Ich habe gestern beim Schreiben wirklich an dich gedacht und extra noch ein paar @error-Abfragen und eine Dateisicherung eingefügt.

**BugFix**

Personalisierungs-Skript für das Template - Post #1

**autoiter**

Na klar. Das ist natürlich auch eine gute Idee.

**Bitnugger**

Ja, in der Tat... eine gute Idee.

Zitat von BugFix

_FileCreateTemplate()

Hm, verstehe nur nicht so ganz, wieso du das Script beendest, wenn keine Template.au3 vorhanden ist? Bei diesem Funktionsnamen hätte ich angenommen, dass eine erstellt wird, falls nötig.

**BugFix**

Wenn noch keines vorhanden ist, ist auch der Registry- Eintrag für Kontextmenü (neue au3-Datei) nicht vorhanden. Somit ist die Erstellung eines Templates funktionslos.

**Bitnugger**

Zitat von BugFix

Wenn noch keines vorhanden ist, ist auch der Registry- Eintrag für Kontextmenü (neue au3-Datei) nicht vorhanden. Somit ist die Erstellung eines Templates funktionslos.

Dann kann man den Registrierungsschlüssel doch hinzufügen...

PersonalizeAU3Template.au3

AutoIt

#Region ;**** Directives created by AutoIt3Wrapper_GUI ****
#AutoIt3Wrapper_Res_requestedExecutionLevel=requireAdministrator
#EndRegion ;**** Directives created by AutoIt3Wrapper_GUI ****


#RequireAdmin


;-- TIME_STAMP   2017-05-28 02:43:27   v 0.1


_FileCreateTemplate()


Func _FileCreateTemplate()
	RegRead('HKCR\.au3', '')
	If @error Then Exit _
		MsgBox(262192, @ScriptName, 'Fehler: Der Registrierungsschlüssel "HKCR\.au3" ist ' & (@error = -1 ? 'leer' : 'nicht vorhanden') & '!')




	Local $sCreator = _GetAU3Property('UDFCreator', @UserName)
	Local $sWrite = _
		"#cs ----------------------------------------------------------------------------" & @CRLF & @CRLF & _
		" AutoIt Version:  " & @AutoItVersion & @CRLF & _
		" Author:          " & ($sCreator = "Your Name" ? @UserName : $sCreator) & @CRLF & @CRLF & _
		" Script Function: AutoIt script." & @CRLF & @CRLF & _
		"#ce ----------------------------------------------------------------------------" & @CRLF & @CRLF & _
		"; Script Start - Add your code below here" & @CRLF


	Local $sFileName = @WindowsDir & "\ShellNew\Template.au3"
	If Not FileExists($sFileName) Then
		Switch MsgBox(262196, @ScriptName, _
				'Fehler: Es wurde kein Template für *.au3 gefunden!' & @CRLF & @CRLF & _
				'Soll ein Template inkl. des benötigten Registrierungsschlüssels erzeugt werden?' & @CRLF & @CRLF & _
				'Template' & @CRLF & _
				'  ' & $sFileName & @CRLF & @CRLF & _
				'Registrierungsschlüssel' & @CRLF & _
				'  Schlüssel' & @TAB & ': "HKCR\.au3\ShellNew\FileName"' & @CRLF & _
				'  Typ' & @TAB & @TAB & ': "REG_SZ"' & @CRLF & _
				'  Wert' & @TAB & @TAB & ': "Template.au3"')
			Case 6 ;Yes
					RegWrite('HKCR\.au3\ShellNew', 'FileName', 'REG_SZ', 'Template.au3')
					If @error Then Exit MsgBox(262192, @ScriptName, 'Fehler: RegWrite() - Du musst das Script als Administrator starten!')
			Case 7 ;No
				Exit
		EndSwitch
	EndIf


	Local $fH = FileOpen($sFileName, 2+128)	; $FO_OVERWRITE (2), $FO_UTF8 (128) (with BOM)
	Local $iSucc = FileWrite($fH, $sWrite)
	FileClose($fH)
	Exit MsgBox(($iSucc = 1 ? 262208 : 262192), ($iSucc = 1 ? 'Fertig!' : 'Fehler!'), ($iSucc = 1 ? _
		'Das personalisierte Template wurde erfolgreich geschrieben.' : 'Das Template konnte nicht geschrieben werden.'))
EndFunc




; #FUNCTION# ====================================================================================================================
; Name ..........: _GetAU3Property
; Description ...: Gets a property value (one-line entry only!). Ask order: 1. SciTEUser.properties 2. au3.properties
; Syntax ........: _GetAU3Property($sProperty[, $sDefault = ''])
; Parameters ....: $sProperty           - The property name
;                  $sDefault            - [optional] A value to use, if none property set. Default is ''.
; Return values .: The value of the property (or the default value)
; Author ........: BugFix
; ===============================================================================================================================
Func _GetAU3Property($sProperty, $sDefault='')
	Local $sPathUserProp = @LocalAppDataDir & "\AutoIt v3\SciTE\SciTEUser.properties"         ; C:\Users\[USER]\AppData\Local\AutoIt v3\SciTE\SciTEUser.properties
	Local $sPathAU3Prop = StringTrimRight(@AutoItExe, 11) & "SciTE\properties\au3.properties" ; C:\Program Files (x86)\AutoIt3\SciTE\properties\au3.properties
	Local $sRead = '', $sValueReturn = $sDefault, $aMatch
	Local $sPattern = $sProperty & "=([^\r\n]+)"
	If FileExists($sPathUserProp) Then $sRead = FileRead($sPathUserProp)
	$aMatch = StringRegExp($sRead, $sPattern, 1)
	If @error Then
		If FileExists($sPathAU3Prop) Then $sRead = FileRead($sPathAU3Prop)
		$aMatch = StringRegExp($sRead, $sPattern, 1)
		If Not @error Then $sValueReturn = $aMatch[0]
	Else
		$sValueReturn = $aMatch[0]
	EndIf
	Return $sValueReturn
EndFunc

Alles anzeigen

**BugFix**

Neu: CheckBOM.lua

Diese Datei ersetzt die bisherige new_as_utf8bom.lua.

Nun wird nicht jede neue Datei mit BOM versehen, sondern nur Dateien, die als au3 gespeichert sind.

Optional lassen sich per Property weitere Dateitypen dafür registrieren.

**Bitnugger**

Zitat von BugFix

Neu: CheckBOM.lua

Schön... baue doch bitte noch eine zweite Property mit ein... für UTF8 ohne BOOM, das wäre dann z.B. für *.lua.

**BugFix**

Ich habe das so, dass ich die Standard Kodierung von SciTE nutze (passt für Lua) und nur Autoit bekommt eine Extrawurst.

Aber ich hatte schon überlegt, für alle Kodierungen die Möglichkeit von Dateitypzuordnungen einzubauen. Werde ich dann noch erledigen.

EDIT

Mist, zu schnell geschossen: BOM ist die einzig existierende Kodierung, die man aus einer Datei auslesen kann (bei UTF16 noch LE und BE).

Somit kann ich nicht feststellen, ob eine Datei UTF8 oder sonstwie kodiert ist.

Die einzige Variante wäre zu sagen, dass alle Dateien, die nicht BOM bekommen sollen mit UTF8 kodiert werden. Da ich nicht feststellen kann, ob das bereits passiert ist (get encoding gibt es nicht), würde das bei jedem Speichern erneut gesetzt. - Das fände ich nicht sehr glücklich gelöst.

**BugFix**

Zitat von Bitnugger

Schön... baue doch bitte noch eine zweite Property mit ein... für UTF8 ohne BOOM, das wäre dann z.B. für *.lua.

Ich habe mal noch eine Alternative erstellt. Da SciTE in der Lage ist ein coding-cookie in den ersten 2 Zeilen zu erkennen, verwende ich das hierbei. Somit ist auch UTF8 ohne BOM sicher erkennbar.

Dafür habe ich noch eine zusätzliche Property UTF8.Cookie.Line=. Braucht nur gesetzt werden, wenn das Cookie in die zweite Zeile soll ansonsten wird es standardmäßig in die erste Zeile geschrieben.

Ich möchte aber gleich noch auf einen "Echo-Effekt" hinweisen. Ich verwende ja TimeStamp, der bei jedem Speichern gesetzt wird. Das beißt sich in dem Fall hiermit, wenn die erste Zeile gelöscht wird (Zeilenumbruch bleibt, Coding-Cookie steht in Zeile 2). Wenn jetzt automatisch der TimeStamp gesetzt wird, schiebt der den vorhandenen Inhalt eine Zeile weiter, somit steht das Cookie in Zeile #3 und ist ungültig - wird somit erneut gesetzt. Das ist aber ein absoluter Ausnahmefall. Ich werde mal die TimeStamp Funktion überarbeiten, dass sie das Cookie berücksichtigt, sofern vorhanden.

Code: ForceEncoding.lua

-- TIME_STAMP   2021-04-20 11:19:47
-- coding:utf-8


--[[
PROPERTIES:
# The only way to detect the UTF8 encoding is using a coding cookie in one of the 1st two lines.
# line to insert the utf8-cookie (1 or 2), default: 1
UTF8.Cookie.Line=

# file types, that needs this codings
# 'utf8' - as default declared: 'lua'
# 'utf8bom' - as default declared: 'au3'
UTF8.File.Types=ext_1 ext_2
UTF8BOM.File.Types=ext_1 ext_2
UTF16LE.File.Types=ext_1 ext_2
UTF16BE.File.Types=ext_1 ext_2

]]

ForceEncoding = EventClass:new(Common)

ForceEncoding.OnSave = function(self, _file)
    local enc = self:NeedsEncoding(props['FileExt'])
    if enc == 'NONE' then return nil end
    if not (self:Get(_file) == enc) then  -- file has not the required encoding
        if enc == 'UTF8' then      -- IDM_ENCODING_UCOOKIE    154    UTF8  (not save without real text cookie!)
            self:InsertUTF8Cookie()
            scite.MenuCommand(IDM_ENCODING_UCOOKIE)
        else
            local tCmd = {['UTF8BOM']=IDM_ENCODING_UTF8,['UTF16LE']=IDM_ENCODING_UCS2LE,['UTF16BE']=IDM_ENCODING_UCS2BE}
            scite.MenuCommand(tCmd.enc)
        end
    end
    return nil
end

-- inserts the coding cookie in line 1 or 2
ForceEncoding.InsertUTF8Cookie = function()
    local l = tonumber(props['UTF8.Cookie.Line']) or 1    -- if prop not set use 1st line
    if l > 2 then l = 2 end                               -- last possible line for this cookie
    local countLines = editor.LineCount
    if countLines < l then l = 1 end                      -- file is empty or has only one line and cookie prop is set to 2
    local lineComment = props['comment.block.'..props['FileExt']]
    l = l -1                                              -- 0-based line index
    local caret = editor.CurrentPos
    local firstVisibleLine = editor.FirstVisibleLine
    local pos = editor:PositionFromLine(l)                -- start position from line
    editor:InsertText(pos, lineComment..' coding:utf-8\n')
    editor:SetSel(caret, caret)
    editor.FirstVisibleLine = firstVisibleLine
end

-- returns the encoding, that the file type needs
ForceEncoding.NeedsEncoding = function(self, _ext)
    local tExt = {}
    tExt["UTF8"]    = props['UTF8.File.Types']:lower()..' lua'
    tExt["UTF8BOM"] = props['UTF8BOM.File.Types']:lower()..' au3'
    tExt["UTF16LE"] = props['UTF16LE.File.Types']:lower()
    tExt["UTF16BE"] = props['UTF16BE.File.Types']:lower()
    for enc in pairs(tExt) do
        if tExt[enc]:find(_ext:lower()) then return enc end
    end
    return 'NONE'
end

-- detects: 'UTF8BOM', 'UTF16LE', 'UTF16BE' by it's byte marker (from file)
-- and 'UTF8' if coding cookie is set on one of the first two lines: (from editor pane)
-- A coding cookie looks similar to "coding: utf-8" ("coding" followed by ':' or '=', optional whitespace, optional quote, "utf-8").
ForceEncoding.Get = function(self, _file)
    local tEnc = {}
    tEnc['UTF8BOM'] = {['len']=3,['hex']="EFBBBF"}
    tEnc['UTF16LE'] = {['len']=2,['hex']="FFFE"}
    tEnc['UTF16BE'] = {['len']=2,['hex']="FEFF"}
    local n, line, fh, content, read = 0
    -- 1st. check for coding cookie (UTF8)
    for i=0, 1 do
        line = editor:GetLine(i)
        if line == nil then break
        else if line:find("coding[:=]%s-['\"]-utf%-8") then return "UTF8" end end
    end
    -- now check for byte marker
    for enc in pairs(tEnc) do
        if self:ToHex(self:ReadLen(_file, tEnc[enc].len)) == tEnc[enc].hex then return enc end
    end
    return 'UNKNOWN'
end

-- reads a count of bytes from a file
ForceEncoding.ReadLen = function(self, _file, _n)
    local fh = io.open(_file, "rb")
    local read = fh:read(_n)
    fh:close()
    return read
end

-- converts a passed string to hex value of its characters
ForceEncoding.ToHex = function(self, _s)
    if _s == nil then return 'DEAD' end
    return (_s:gsub('.', function(_c) return ('%02X'):format(_c:byte()) end))
end

Alles anzeigen

**Bitnugger**

Der TimeStamp macht bei einigen Dateierweiterungen Probleme, wenn er in der ersten Zeile ist... z.B.: *.py

Um in Python 2.x Source files utf-8 zu verwenden, genügt es folgenden Teil ganz oben in den Header der Datei zu platzieren:

#!/usr/bin/env python

# -*- coding: utf-8 -*-

Anschließend ist es möglich ganz normal utf-8 zu verwenden:

test = 'äöüß'

uu = test.decode('utf8')

string = uu.encode('cp1250')

print(string)

Wichtig: Unter Python 3 ist dies nicht mehr erforderlich, da es dort das Standard Encoding ist.

BugFix 15. April 2021 um 13:53