Texterkennung aus Bild

  • hallo Gemeinde, 8|
    kennt sich jemand mit GOCR aus ?

    ;Schreibe den Text aus dem Bild 002.pnm in die Datei test2.txt
    RunWait("gocr045 002.pnm -o test2.txt",@scriptDir,@SW_HIDE)

    Soweit alles bestens (Trefferquote 75%).
    Nun soll man aber gocr auch "trainieren" können.
    Aber wie genau das nun geht, steht nirgends genau.

    Meine Frage:
    1)Wie lege ich für gocr eine eigene funktionierende Datenbank an
    2)Wie bringe ich gocr dazu, diese Datenbank zu lesen

    Danke fuer konstruktive Antworten
    @Berti

  • Hallo.

    Vielleicht schreibst Du uns mal genau, was Du vor hast und wie weit Du bist. Mit einem evtl. vorhandenen Quellcode (muß nicht AutoIt, sondern geht evtl. auch php oder html sein), den Du per Suchfunktion (http://www.google.de/) gefunden hast, könnte Dir evtl. um einiges besser bei dem Thema geholfen werden.

    Einfach etwas "googlen" und wenn Du da was findest, es hier einfach posten. Such doch mal, ob es soetwas evtl. schon als PHP gibt oder was sagt das berühmte Wiki?

    LG und ein schönes Adventwochenende.

    Lina.

    Lieben Gruß,
    Alina

    ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

    Geheime Information: ;)
    k3mrwmIBHejryPvylQSFieDF5f3VOnk6iLAVBGVhKQegrFuWr3iraNIblLweSW4WgqI0SrRbS7U5jI3sn50R4a15Cthu1bEr

  • hallo Progandy, :wacko:
    ich hatte das Tool von Deinem Link heruntergeladen...

    Vielleicht hätte ich erwähnen sollen, daß die "Dokumentation"
    des Projektes GOCR/JOCR mich nicht wirklich weiterbringt.

    ===============================
    === Wie trainiere ich GOCR ? === ;(
    ===============================

    Bitte nur direkte Antwort auf die Frage, keine Links
    Gruss @Berti

    Einmal editiert, zuletzt von bertizwo (16. Dezember 2007 um 13:12)

  • hallo Gemeinde, :sleeping:
    da die Antwort anscheinend auf sich warten laesst
    hier nun von mir die Antwort auf die Frage,
    wie man gocr "per Hand" trainiert.

    1.)Voraussetzung:
    -Bild in pnm-Format, das die gewuenschten Zeichen enthaelt
    -der Unterordner fuer die Datenbank
    -Suchbild mit den zu suchenden Zeichen

    2.)Eigene Datenbank interaktiv anlegen, gocr-engine dabei ausschalten
    cmd> gocr font.pnm -m 256 -m 130 -p ./db/

    3a) Eigene Datenbank ausschliesslich, ohne gocr-engine nutzen
    cmd> gocr suchbild.pnm -m 256 -m 2

    3b) Eigene Datenbank zusaetzlich zur gocr-engine nutzen
    cmd> gocr suchbild.pnm -m 2

    -p ./db/ brauch in [3a] || [3b] nicht mit angegeben werden,
    da dies der default - Wert fuer die Datenbank.

    Viel Spass/Geduld/Zeit/Nerven
    beim testen dieser und anderer Parameter...
    ..und der Suche nach einem vernuenftigen Tutorial fuer GOCR
    @Berti