PDF Datei auslesen

  • Hi @ all,

    ich habe mehrere Tabellen in einem PDF Dokument die ich gerne automatisch in Excel schreiben würde. Ich weiß nur nicht wie ich sie aus dem PFD Dokument herausbekomme? Kann man das irgendwie einlesen, dass man die Wörter erhält?
    Leider kann ich die Datei nicht anhängen, da sie vertrauliche Informationen enthält, aber vielleicht hat jemand ja zufällig ein Beispiel zur Hand.

    Viele Grüße
    Aquaplant

    3 Mal editiert, zuletzt von Aquaplant (21. Juni 2010 um 10:40)

  • Hallo Aquaplant,

    das ist nicht so einfach.
    Vielleicht mit Aufruf PDF-Dokument / Alles in Clipboard / in Script übernehmen + auswerten
    oder
    Umwandeln PDF in Text / Einlesen in Script / Auswerten

    Andere Idee habe ich auch nicht
    Grüße
    Carsten

  • Hi,
    beim Foxit Reader ist ein Textviewer dabei, der aus einer Tabelle einen Fließtext macht, ggf hilft dir das weiter.

    /edit/ dieses VB-Macro gerade bei google gefunden, das an AutoIt anzupassen sollte ja mit der excel-udf nicht schwer sein

    [autoit]

    Option Explicit

    [/autoit][autoit][/autoit][autoit]

    Sub Versuch_SendKey()
    'pdf-Programm:
    Const strPdfProgNam As String = "C:\...\AcroRd32.exe"
    'pdf-Datei:
    Const strPdfNam As String = "G:\...\Datei.pdf"

    If ActiveSheet.Cells(1, 1) <> "" Then
    Exit Sub
    End If

    [/autoit][autoit][/autoit][autoit]

    'pdf öffnen
    Shell """" & strPdfProgNam & """ """ & strPdfNam & """", vbNormalFocus

    'Zwischenablage:
    SendKeys "^a", True
    SendKeys "^c", True

    'pdf Schließen:
    SendKeys "%{F4}"

    'In Excel-Tabellenblatt einfügen
    ActiveSheet.Paste

    [/autoit][autoit][/autoit][autoit]

    End Sub

    [/autoit]

    ciao
    Andy


    "Schlechtes Benehmen halten die Leute doch nur deswegen für eine Art Vorrecht, weil keiner ihnen aufs Maul haut." Klaus Kinski
    "Hint: Write comments after each line. So you can (better) see what your program does and what it not does. And we can see what you're thinking what your program does and we can point to the missunderstandings." A-Jay

    Wie man Fragen richtig stellt... Tutorial: Wie man Script-Fehler findet und beseitigt...X-Y-Problem

    Einmal editiert, zuletzt von Andy (20. Juni 2010 um 21:19)

  • Bin mir nicht sicher, aber das Öffnen sollte evtl. mit ShellExecute funktionieren. Anschließend dann mit "Send(^a)" alles markieren.

  • Hab das gerade mal getestet, funktioniert einwandfrei mit Openoffice.
    Tabelle erstellt und als pdf gespeichert.
    Per AutoIt-Shellexecute das pdf öffnen, ctrl+a markiert die Tabelle im pdf, Daten mit ctrl-c in die Zwischenablage oder sonstwohin (textfile).
    In OO-Calc per ctrl-v einfügen führt zur Abfrage nach Trennzeichen, dort "Leerzeichen" anklicken (lassen), fertig.
    Allerdings werden die Textformatierungen (Fett usw) nicht mit aus dem PDF übernommen, ausschliesslich der reine (Tabellen)Text.