Hallo zusammen,
ich möchte aus vielen PDF Dateien die Tabellen in eine Excel liste exportieren.
Die gänigen "PDF zu text" Tools zerstören aber den zusammenhang der Tabelle.
Wäre es daher möglich mit Autoit das PDF in einer GUI anzuzeigen und den User mittels Linien (Horizontal / Vertikal) den Rahmen der Tabelle einzuzeichnen, und aus diesen Coordinaten dann mittels OCR den Text zu erkennen und als csv/excel zu exportieren?
Somit wäre das Tool universell einsetzbar, egal wie die PDF aufgebaut ist.
Oder habt ihr ganz andere Ideen?
Ich lese mich gerade mal in GDIPlus ein...eventuell ist das ja schonal der Richtige start....
Danke schonmal