Ich benutze PDFBox 2.8 und ich muss: < /p>
Die Positionen spezifischer Platzhalter -Zeichenfolgen wie: < /p>
@@ Signature_Client@extrahieren @
@@ Signature_Customer @@
Aus einem PDF -Dokument. so viel wie möglich. File inputFile = new File("exemple.pdf");
PDDocument document = PDDocument.load(inputFile);
for (PDPage page : document.getPages()) {
InputStream is = page.getContents();
if (is != null) {
String content = new String(is.readAllBytes(), "ISO-8859-1");
is.close();
content = content.replaceAll("@@[^@]+@@", " ");
PDStream newStream = new PDStream(document);
OutputStream os = newStream.createOutputStream(COSName.FLATE_DECODE);
os.write(content.getBytes("ISO-8859-1"));
os.close();
page.setContents(newStream);
}
}
document.save("output.pdf");
document.close();
< /code>
Wenn sich der Text jedoch in einer Tabelle oder einem Rechteck befindet und der Text eine Farbe oder eine Hintergrundfarbe hat, wird er nicht gelöscht. < /p>
< P> Könnten Sie mich telen, um dies zu beheben?
Danke!
Extrahieren Sie die Position der Musterzeichenfolge in einem PDF -Dokument und ersetzen Sie sie durch leere Zeichenfolge ⇐ Java
-
- Similar Topics
- Replies
- Views
- Last post