ZitatBei einem 2000x2000 Bild 15 ms rechendauer.
hehe, bei der "Rechendauer" ist der gesamte FASM-Kram noch dabei, das heisst incl. Programm Assemblieren!
Bei meinem Referenz-P3 mit 1,2Ghz dauert z.B. das Assemblieren genauso lange wie das die eigentliche ASM-Programmlaufzeit!
Mal schauen, was die SSE-Befehle bringen, ich hoffe, ich habe in der nächsten Woche bissl mehr Zeit...
Aber Faktor 2-3 sollte mindestens dabei rauskommen.
Aber auch mein selbstausgedachter Algorithmus ist nicht der langsamste, ein Referenzprogramm in C# hab ich jedenfalls schonmal um Faktor 50 abgehängt. Der prüft jedes Pixel des Buffers erstmal, ob es überhaupt im Viereck liegt. Das dauert... ![]()
Da der ASM-Code threadsicher ist, könnte man natürlich auch mehrere Kerne einbinden! Dazu muss der Assemblercode nicht geändert werden, das funktioniert auch direkt aus AutoIt!