Konvertieren Sie PDF mit Java in CSVJava

Java-Forum
Anonymous
 Konvertieren Sie PDF mit Java in CSV

Post by Anonymous »

Ich habe die meisten Dinge beim Stapelüberlauf und außerhalb ausprobiert

Problem:
Ich habe ein PDF mit Inhalt und Tabellen.
Ich muss auch Tabellen und Inhalte analysieren.

APIs:
https://github. com/tabulapdf/tabula-java
Ich verwende tabula-java, das einige Inhalte ignoriert und Inhalte in Tabellenzellen nicht richtig getrennt sind.

MEIN PDF hat solche Inhalte

DATE :1/1/2018 ABCD SCODE:FFFT
--ACCEPTED--
USER:ADMIN BATCH:RR EEE
CON BATCH
=======================================================================
MAIN SNO SUB VALUE DIS %
R 12 rr1 0125 24.5
SLNO DESC QTY TOTAL CODE FREE
1 ABD 12 90 BBNEW -NILL-
2 XDF 45 55 GHT55 MRP
3 QWE 08 77 CAT -NILL-
=======================================================================
MAIN SNO SUB VALUE DIS %
QW 14 rr2 0122 24.5
SLNO DESC QTY TOTAL CODE FREE
1 ABD 12 90 BBNEW -NILL-
2 XDF 45 55 GHT55 MRP
3 QWE 08 77 CAT -NILL-


Tabula-Code zum Konvertieren:

public static void toCsv() throws ParseException {
String commandLineOptions[] = { "-p", "1", "-o", "$csv", };
CommandLineParser parser = new DefaultParser();
try {
CommandLine line = parser.parse(TabulaUtil.buildOptions(), commandLineOptions);
new TabulaUtil(System.out, line).extractFileInto(
new File("/home/sample/firstPage.pdf"),
new File("/home/sample/onePage.csv"));
} catch (Exception e) {
e.printStackTrace();
}
}


tabula unterstützt sogar die Befehlszeilenschnittstelle

java -jar TabulaJar/tabula-1.0.2-jar-with-dependencies.jar -p all -o $csv -b Pdfs


Ich habe versucht, -c,--columns von tabula
zu verwenden, was bedeutet, dass Zellen anhand der X-Koordinaten der Spaltengrenzen erfasst werden

Aber das Problem ist, dass der Inhalt meiner PDFs dynamisch ist. d.h. Tabellengrößen werden geändert.

Diese Links im Stapelüberlauf und viele andere haben bei mir funktioniert.

Wie PDF mit tabula-py in CSV konvertieren?

Wie extrahiere ich Tabellendaten aus PDF als CSV über die Befehlszeile?

PDF in Java in Excel konvertieren

Anleitung Eine PDF-Datei in eine CSV-Datei konvertieren?

itext PDF in CSV konvertieren

PDF-Tabelle analysieren und als anzeigen CSV (Java)

Ich habe eine PDF-Box verwendet, die unformatierten Text liefert, bei dem ich den Tabelleninhalt nicht richtig lesen kann.

Es ist möglich, PDFs mit Tabellen in zu konvertieren csv/excel mit Java, ohne Inhalt und Formatierung zu verlieren.

Ich möchte keine kostenpflichtigen Bibliotheken verwenden.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post