Scannen - Dateien automatisch umbenennen und verschieben

  • Hallo

    Thema "papierloses Büro".
    Ich möchte eine stumpfe monotone Arbeit automatisieren.
    Ich kann mir vorstellen, dass autoit mir helfen kann, muss dazu allerdings sagen, dass ich kein Programmierer bin.
    Ich mag mich nicht in das Programm einarbeiten (für mich auf jeden Fall MÜHSAM!) nur um vielleicht später feststellen zu müssen, dass ich meine Aufgabe mit autoit gar lösbar ist.
    Deswegen meine Bitte an die Experten hier, ob das , was ich möchte überhaupt mit autoit umsetzbar ist.

    Wenn ich Dateien scannen sind sie damit weder sinnvoll benannt und noch im richtigen Ordner abgelegt.
    Genau das möchte ich gerne automatisieren:
    Ich klebe auf jedes gesannte Dokument zwei Etiketten drauf, eines mit Informationen für den Dateinamen (ID) , ein weiteres für den Speicherort.
    Da jeder Scan in eine lesbare PDF umgewandelt wird, sind auch die Infos von den Etiketten auslesbar und verwertbar.
    Durch eindeutige Sonderzeichen als Erkennungssequenz wird sichergestellt, dass der Etikettentext gefunden und richtig verwendet werden kann für Umbennung und Verschieben in das richtige Verzeichnis und nicht irgendein anderer Text aus dem Dokument zu unsinnigen Ergebnissen führt.

    Beispiel für Dateinamen bzw. Umbennenung:
    ##2014-34561 ist die eindeutige ID der Datei und soll am Ende des Dateinamens vor ".pdf" eingefügt werden.

    §§Belege2014 bedeutet, dass die Datei in einem vordefinierten Verz. in den Ordner "Belege2014" verschoben werden soll.
    Dabei ist wichtig: Wenn der Order dort noch nicht besteht, dann sollte er neu angelegt werden.

    Kann ich diese Aufgabe mit autoit lösen?
    Lässt sich
    a) eine lesbare PDF Datei auslesen?
    b) nach bestimmten Zeichenfolgen durchsuchen ("##")?
    c) die auf "##" folgenden 10 Zeichen in den Dateinamen hinzufügen?
    d) nach "§§" duchsuchen ?
    e) aus den 10 Zeichen die auf "§§" folgen (Belege2014) eine Verschiebeaktion in das Verzeichnis D:\dokumente\scans\Belege2014 starten?
    f) und wenn es das Verzeichnis Belege2014 noch nicht gibt, lässt sich das Verzeichnis D:\dokumente\scans\Belege2014 mit autoit anlegen?

    Würde mich über Eure Meinung/Kommentare zu der Aufgabenstellung freuen.
    Viele Grüße
    Steven

  • Ich weiß jetzt nicht genau, was du mit "lesbarem" Pdf meinst (ein unlesbares wäre irgendwie sinnlos).
    Aber:
    http://www.chip.de/downloads/Some…r_31735164.html
    Konvertiert PDF zu text. Vielleicht funktioniert das bei dir, sodass man dann die txt einlesen kann, die infos auslesen und verarbeiten kann.
    (Kommt vielleicht auch darauf an, ob deine PDF aus Bildern bestehen oder aus text).

  • Sorry für Uneindeutigkeit, mit "lesabar" meinte ich das:

    Die gescannten Dokumente sind als PDF gespeichert, eine OCR Software ist bereits drübergelaufen, d.h. die PDFs sind durchsuchbar nach Text - im Gegensatz zu PDF-Scans welche nur als Grafik vorliegen.
    Meine "Marker" von den Etiketten sind also auffindbar.

  • Na dann. Wenn du deine Marker mit einem normalen Texteditor wie z.B. Notepad++ in der PDF-Datei findest, sollte der Automatisierung eigentlich nichts mehr im Wege stehen. Denn dann kann man auch mit AutoIt die Marker Problemlos auslesen.

    Wenn möglich stell bitte eine Beispiel PDF für Tests zur verfügung.
    Hat die ID immer die selbe Länge und ist nur aus Zahlen aufgebaut?

    ~IRC: irc.afterworkchat.de #autoit

    Einmal editiert, zuletzt von Photon (8. März 2015 um 01:32)

  • Hallo

    Danke schon mal für die Antworten und Gedanken dazu!
    Freut mich sehr, dass alles machbar ist!

    Ich musste mir nun erst einige Gedanken machen, um die Aufgabe zu konkretisieren.

    Automatische Umbennung der PDF Scans:
    Dem Dateinamen sollen "tags" angefügt werden.
    Es sind mehrere tags für jede Datei möglich.
    Die tags beginnen immer mit einer Startsequenz (hier: "#-") und enden mit einer Stopsquenz (hier : "-#".)
    Die Textlänge dazwischen kann variieren.
    Alle Tags sollen dem bestehenden Dateinamen angehängt werden.
    Das Tag , was zuerst kommt (oben stehend bzw. links) soll zuerst in den Dateinamen.
    Der Tankbeleg 2015-03-09_20-38-06_scan15470081.pdf
    wird also zu 2015-03-09_20-38-06_scan15470081#-2015-##-ST-##-TA-#.pdf
    Lässt man das script zweimal drüber laufen, sollten nur zwischenzeitliche manuelle Änderungen//Zusätze in der Datei dem Dateinamen weiter hinzugefügt werden, tags sollten aber auf keinen Fall verdoppelt werden!

    Automatisches Verschieben der Dateien:
    Für das Verschieben ist folgende Info in der Datei: #VZ--Belege-2015-#
    Beim (separaten!) Vorgang des Verschiebens soll der Tankbeleg in das Verzeichnis "Belege-2015" verschoben werden.
    Den Pfad des übergordneten Verzeichnisses (Bsp.: D:\Dokumente\Scans\ ) will ich selbst definieren//eingeben können.
    Falls das Verzeichnis "Belege-2015" dort noch nicht existiert, soll es gebildet werden ( D:\Dokumente\Scans\Belege-2015 ).

    Die Markiererstart und endzeichen , derzeit #- #VZ- -# würde ich gerne selbst ändern//defieren können, denn ich bin noch nicht 100pro sicher, dass genau diese imer gut erkannt werden (Texterkennungen haben ihre Tücken).

    2 Musterfiles (scans) liegen hier:
    https://www.dropbox.com/s/be3tv9dn2q70kmm/scans_1a.zip?dl=0


    Also, falls es hier jemand gibt, der das machen kann.
    Das wäre SUPER!!!
    Gerne zahle ich auch was dafür. Aus dem Bauch raus ist mir das funktionierende script 150 Euro wert. Sollte das zu wenig sein (ich habe keine Ahnung wie aufwendig diese Arbeit ist!), bitte Nachricht.

    Viele Grüße
    Steven


    Garantiert ist für die lösung dieses Problems nicht nur von mir höchste Anerkennung sicher!
    Denn es gibt eine sehr große Usergemeinde die momentan noch mühsam ihre gescannten Dateien "pflegt" und "hegt" mit Umbennen und Verzeichnisverschieberei.
    Eine meiner Meinung nach völlig nervige :thumbdown: und überflüssige Arbeit -weil komplett automatisierbar :)
    Die meisten wissen vielleicht gar nicht, wie unnötig diese Arbeit ist... 8)
    http://www.heise.de/ct/ausgabe/201…9.html#comments

  • Hättest keinen zweiten Thread aufmachen müssen. Man verschiebt lieber diesen Thread in das andere Forum.

    Also ich habe mal die PDF's nach deinen Markern durchsucht, von dem ich gehofft hatte das du das bereits versucht hast, und musste leider feststellen das deine Marker in den PDF's nicht auftauchen.

    Werde es mir morgen nochmal anschauen.
    Aber wenn die Marker tatsächlich nicht darin auftauchen ist es wohl doch notwendig über den Weg der OCR Software oder den von Kanashius mit dem PDFzu-Text Konvertierer zu gehen.

    ~IRC: irc.afterworkchat.de #autoit

    Einmal editiert, zuletzt von Photon (11. März 2015 um 19:30)

  • Ok man muss doch noch den Text mittels dem von Kanashius vorgeschlagenen Programm aus der PDF extrahieren. Wäre ja sonst auch zu einfach gewesen.

    Falls sich die Sache mit Kanashius Programm erledigt hat, bitte den Thread Status auf gelöst setzen.

    ~IRC: irc.afterworkchat.de #autoit