Extrahieren Sie die Position der Musterzeichenfolge in einem PDF -Dokument und ersetzen Sie sie durch leere Zeichenfolge

Extrahieren Sie die Position der Musterzeichenfolge in einem PDF -Dokument und ersetzen Sie sie durch leere Zeichenfolge ⇐ Java

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Extrahieren Sie die Position der Musterzeichenfolge in einem PDF -Dokument und ersetzen Sie sie durch leere Zeichenfolge

Post by Anonymous » 17 Feb 2025, 10:25

Ich benutze PDFBox 2.8 und ich muss: < /p>
Die Positionen spezifischer Platzhalter -Zeichenfolgen wie: < /p>
@@ Signature_Client@extrahieren @

@@ Signature_Customer @@

Aus einem PDF -Dokument. so viel wie möglich. File inputFile = new File("exemple.pdf");
PDDocument document = PDDocument.load(inputFile);

for (PDPage page : document.getPages()) {
InputStream is = page.getContents();
if (is != null) {

String content = new String(is.readAllBytes(), "ISO-8859-1");
is.close();

content = content.replaceAll("@@[^@]+@@", " ");

PDStream newStream = new PDStream(document);
OutputStream os = newStream.createOutputStream(COSName.FLATE_DECODE);
os.write(content.getBytes("ISO-8859-1"));
os.close();

page.setContents(newStream);
}
}

document.save("output.pdf");
document.close();
< /code>
Wenn sich der Text jedoch in einer Tabelle oder einem Rechteck befindet und der Text eine Farbe oder eine Hintergrundfarbe hat, wird er nicht gelöscht. < /p>
< P> Könnten Sie mich telen, um dies zu beheben?
Danke!

1739784317

Anonymous

Ich benutze PDFBox 2.8 und ich muss: < /p>
Die Positionen spezifischer Platzhalter -Zeichenfolgen wie: < /p>
@@ Signature_Client@extrahieren @

@@ Signature_Customer @@

Aus einem PDF -Dokument. so viel wie möglich.    File inputFile = new File("exemple.pdf");
PDDocument document = PDDocument.load(inputFile);

for (PDPage page : document.getPages()) {
InputStream is = page.getContents();
if (is != null) {

String content = new String(is.readAllBytes(), "ISO-8859-1");
is.close();

content = content.replaceAll("@@[^@]+@@", " ");

PDStream newStream = new PDStream(document);
OutputStream os = newStream.createOutputStream(COSName.FLATE_DECODE);
os.write(content.getBytes("ISO-8859-1"));
os.close();

page.setContents(newStream);
}
}

document.save("output.pdf");
document.close();
< /code>
Wenn sich der Text jedoch in einer Tabelle oder einem Rechteck befindet und der Text eine Farbe oder eine Hintergrundfarbe hat, wird er nicht gelöscht. < /p>
< P> Könnten Sie mich telen, um dies zu beheben? 
Danke!

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

So vermeiden Sie, dass das Dokument dauerhaft verschoben wurde. Das Dokument wurde hierher verschoben

Last post by Anonymous « 29 Dec 2024, 10:06
Posted in Php

by Anonymous » 29 Dec 2024, 10:06 » in Php

Ich befinde mich auf einer Site und rufe eine API auf, die sich auf einer anderen Site befindet. Also baue ich einen Curl

$url = ........
$curl_data = array('name'=>$name);
$ch = curl_init();...

0 Replies

28 Views

Last post by Anonymous
29 Dec 2024, 10:06
So füllen Sie Daten in Spring Boot dynamisch in den Dokument von Word Dokument in Tripel ein

Last post by Anonymous « 19 May 2025, 06:57
Posted in Java

by Anonymous » 19 May 2025, 06:57 » in Java

Ich bin in einem Java Spring Boot -Projekt. Derzeit erhielt ich die Aufgabe, dynamische Daten (von der Frontendanfrage DTO zu befragen) zu füllen, um die WordDocument -Vorlage zu sprudeln, und dass...

0 Replies

3 Views

Last post by Anonymous
19 May 2025, 06:57
Wie kann ich bestimmte Felder aus einem Dokument extrahieren?

Last post by Guest « 28 Jan 2025, 07:01
Posted in Python

by Guest » 28 Jan 2025, 07:01 » in Python

Ich habe PDFPLumber verwendet, um Texte aus PDF zu extrahieren, aber es enthält mehrere Tags wie \ n , \ t , u2019 und viele Räume dazwischen. Ich muss diesen Text in ein LLM übergeben, um bestimmte...

0 Replies

14 Views

Last post by Guest
28 Jan 2025, 07:01
Polaren – Ersetzen Sie den Buchstaben in der Zeichenfolge durch einen Großbuchstaben

Last post by Guest « 15 Jan 2025, 17:19
Posted in Python

by Guest » 15 Jan 2025, 17:19 » in Python

Gibt es in Polarzeichen eine Möglichkeit, Zeichen direkt nach dem _ mithilfe von Regex-Ersetzen durch Großbuchstaben zu ersetzen? Bisher habe ich es mit polars.Expr.map_elements erreicht.
Gibt es...

0 Replies

12 Views

Last post by Guest
15 Jan 2025, 17:19
ITEXT 9 - Unterzeichnung eines PDF mit einem externen Dienst - "Dokument wurde geändert oder beschädigt, nachdem die Sig

Last post by Anonymous « 28 Mar 2025, 13:26
Posted in Java

by Anonymous » 28 Mar 2025, 13:26 » in Java

Ich möchte ein Dokument unter Verwendung einer externen API unterschreiben. Sie können einen Hash Ihres Dokuments an diesen Service senden und einen signierten Hash zurückholen. private String...

0 Replies

8 Views

Last post by Anonymous
28 Mar 2025, 13:26

Return to “Java”