PDF auslesen

  • Hallo,

    ich benötige eine Möglichkeit um bei einem PDF-Formular auszulesen ob eine Checkbox angehakt ist oder nicht. Hat da jemand eine Idee für mich ?

    Grüße

    Markus

  • hmmm,

    wenn Du Dir ein einfaches PDF mit aktivierter Checkox erstellst, dieses als PDF 1 speicherst, danach das Dokument öffnest, die Checkbox abwählst, Dokument unter PDF 2 speicherst, wirst Du bei Öffnen und Vergleichen der beiden PDFs mit z.B. Notepad ++ feststellen, dass die Pdfs nur in zwei Zeilen verschieden sind. Das mit der aktiven Checkbox ist eine Zeile länger. Die Unterschiede sind herausarbeitbar.

    Nun kommt es also auf die Gestalltung Deines Formulars an. Wieviele Checkboxen usw.

    Ein anderer Ansatz ist, mit der Checkbox die Du auswählen willst, eine Java Aktion verbinden....

    LG

    Peter

    Hinweise auf Suchmaschinen finde ich überflüssig - wer fragt hat es nicht gefunden oder nicht verstanden. Die Antwort gibt sich oftmals schneller als der Hinweis auf Dr. Goggle & Co.

    Ab 19-10-22 ergänzt um:

    Die Welt wird nicht bedroht von den Menschen, die böse sind, sondern von denen, die das Böse zulassen. (Albert Einstein)

  • Ich mache es über die Konsole mit dem Konsolenprogramm pdftk-Server. Damit kannst du dir das gesamte Formular auslesen.

    Schaut dann, wenn man es als Textdatei ausgeben lässt, so aus:

    Anderer Weg würde über Adobe PDF Reader gehen und sich das ganze zB als *.xfdf speichern zu lassen, geht auch mit anderen PDF Readern zB mit dem Foxit Reader. Diese *.XFDF datei würde dann so ausschauen:

    Es gibt drei Wahrheiten: deine Wahrheit, meine Wahrheit und die Wahrheit

  • Ich mache es über die Konsole mit dem Konsolenprogramm pdftk-Server. Damit kannst du dir das gesamte Formular auslesen.

    Schaut dann, wenn man es als Textdatei ausgeben lässt, so aus:

    Anderer Weg würde über Adobe PDF Reader gehen und sich das ganze zB als *.xfdf speichern zu lassen, geht auch mit anderen PDF Readern zB mit dem Foxit Reader. Diese *.XFDF datei würde dann so ausschauen:

    Genau das was ich gesucht habe. Vielen Dank !

  • Schön das es passt.,

    Was ich noch vergessen hatte zu Schreiben. Mit dem pdftk-Tool kannst du nur auslesen und nicht ein Formular beschreiben.

    Bei der zweiten Methode, wenn man sich noch die *.xfdf speichert, kann man beides, zum einen auslesen und zum anderen beschreiben.

    Kann ja sein, dass es der ein oder andere braucht.

    Es gibt drei Wahrheiten: deine Wahrheit, meine Wahrheit und die Wahrheit

  • oh-ha

    da benutze ich pdf-tk seit (gefühlt mehr als einem Jahrzehnt) und habe verpennt dass es etwas neues gibt bzw. auf die Idee das in der Server Version zu suchen bin ich tatsächlich nicht gekommen. Danke für den Hinweis. Das macht mal wieder das eine oder andere einfacher.

    Hatte mich schon in die Analyse von PDF Code verbissen.

    Vielleicht noch ein Hinweis bordermax : Es mag ev sinnvoll sein, das ausgelesene Formular zur weiteren Bearbeitung zu sperren, das kann pdf-tk auch..

    LG

    Peter

    Nachtrag: Wenn man genau schaut geht das auch schon in äteren pdftk (Standard) Versionen

    pdftk F:\test_input.pdf dump_data_fields output F:\test_output.txt

    Hinweise auf Suchmaschinen finde ich überflüssig - wer fragt hat es nicht gefunden oder nicht verstanden. Die Antwort gibt sich oftmals schneller als der Hinweis auf Dr. Goggle & Co.

    Ab 19-10-22 ergänzt um:

    Die Welt wird nicht bedroht von den Menschen, die böse sind, sondern von denen, die das Böse zulassen. (Albert Einstein)

    Einmal editiert, zuletzt von Peter S. Taler (16. April 2023 um 14:33)