Extrahieren Sie die Position der Musterzeichenfolge in einem PDF -Dokument und ersetzen Sie sie durch leere ZeichenfolgeJava

Java-Forum
Anonymous
 Extrahieren Sie die Position der Musterzeichenfolge in einem PDF -Dokument und ersetzen Sie sie durch leere Zeichenfolge

Post by Anonymous »

Ich benutze PDFBox 2.8 und ich muss: < /p>
Die Positionen spezifischer Platzhalter -Zeichenfolgen wie: < /p>
@@ Signature_Client@extrahieren @

@@ Signature_Customer @@

Aus einem PDF -Dokument. so viel wie möglich. File inputFile = new File("exemple.pdf");
PDDocument document = PDDocument.load(inputFile);

for (PDPage page : document.getPages()) {
InputStream is = page.getContents();
if (is != null) {

String content = new String(is.readAllBytes(), "ISO-8859-1");
is.close();

content = content.replaceAll("@@[^@]+@@", " ");

PDStream newStream = new PDStream(document);
OutputStream os = newStream.createOutputStream(COSName.FLATE_DECODE);
os.write(content.getBytes("ISO-8859-1"));
os.close();

page.setContents(newStream);
}
}

document.save("output.pdf");
document.close();
< /code>
Wenn sich der Text jedoch in einer Tabelle oder einem Rechteck befindet und der Text eine Farbe oder eine Hintergrundfarbe hat, wird er nicht gelöscht. < /p>
< P> Könnten Sie mich telen, um dies zu beheben?
Danke!

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post