Wie extrahiere ich Gujarati-Text und mathematische Symbole korrekt aus PDF mit iText7 in C#? [geschlossen]

Wie extrahiere ich Gujarati-Text und mathematische Symbole korrekt aus PDF mit iText7 in C#? [geschlossen] ⇐ C#

1 post • Page 1 of 1

Anonymous

Wie extrahiere ich Gujarati-Text und mathematische Symbole korrekt aus PDF mit iText7 in C#? [geschlossen]

Report
Quote

Post by Anonymous » 21 Oct 2025, 15:38

Meine PDF-Datei enthält Gujarati-Text, Englisch, mathematische Formeln und Chemiesymbole. Diese Unicode-Zeichen werden nicht korrekt extrahiert.
Wenn ich Text mit iText7 extrahiere, werden Gujarati-Zeichen durch nicht lesbaren Text ersetzt.
Mein C#-Programm:

Code: Select all

using (var pdfReader = new PdfReader(file.OpenReadStream()))
using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){
var sb = new StringBuilder();
for (int page = 1; page

1761053898

Anonymous

Meine PDF-Datei enthält Gujarati-Text, Englisch, mathematische Formeln und Chemiesymbole. Diese Unicode-Zeichen werden nicht korrekt extrahiert.
Wenn ich Text mit iText7 extrahiere, werden Gujarati-Zeichen durch nicht lesbaren Text ersetzt.
Mein C#-Programm:
[code]using (var pdfReader = new PdfReader(file.OpenReadStream()))
using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){
var sb = new StringBuilder();
for (int page = 1; page

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann man ein PDF in zwei Schritten mit iText7 und externer Signatur richtig unterschreiben?

Last post by Anonymous « 11 Apr 2025, 12:18
Posted in C#

by Anonymous » 11 Apr 2025, 12:18 » in C#

Ich muss einen zweistufigen PDF-Signaturprozess unter Verwendung von iText in C#implementieren. /> Eine externe Firma (Firma A) signiert den Hash und gibt die Signatur zurück.public...

0 Replies

45 Views

Last post by Anonymous
11 Apr 2025, 12:18
So überprüfen Sie die PDF -Größe, während Sie sie mit iText7 schreiben

Last post by Anonymous « 25 Feb 2025, 19:58
Posted in C#

by Anonymous » 25 Feb 2025, 19:58 » in C#

Ich verwende ITEXT7, um eine PDF zu generieren. Ich möchte seine Größe beim Schreiben überprüfen, denn wenn es über 20 MB ist, möchte ich sie speichern und die verbleibenden Teile einer neuen PDF...

0 Replies

56 Views

Last post by Anonymous
25 Feb 2025, 19:58
So fügen Sie dem Signaturfeld eines digital signierten PDF mit ITEXT7 eine Bitmap hinzu

Last post by Anonymous « 10 Apr 2025, 13:25
Posted in C#

by Anonymous » 10 Apr 2025, 13:25 » in C#

Mit ITEXT7 verwende ich SignerProperties und SignatureFieldAppearance, um einem digital signierten Dokument ein Signaturfeld hinzuzufügen. Mit der SetContents -Funktion füge ich einen Text und eine...

0 Replies

45 Views

Last post by Anonymous
10 Apr 2025, 13:25
Rendern mathjax beim Konvertieren von JS HTML in PDF mit iText7 in C# .NET 8.0

Last post by Anonymous « 20 Apr 2025, 02:54
Posted in C#

by Anonymous » 20 Apr 2025, 02:54 » in C#

Ich versuche, JS zu bewerten und von HTML nach PDF mit ITEXT7 in C# zu konvertieren, wobei Selenium WebDrive und Headless Chrome diesem Beispiel folgen. Ich mache dies hauptsächlich, um zu versuchen,...

0 Replies

56 Views

Last post by Anonymous
20 Apr 2025, 02:54
Wie extrahiere ich Bilder aus einem PDF mit der Poppler -Bibliothek in C ++?

Last post by Anonymous « 12 Apr 2025, 18:39
Posted in C++

by Anonymous » 12 Apr 2025, 18:39 » in C++

Ich habe ein PDF, aus dem ich einige Bilder mit C ++ extrahieren möchte. Ich kann leicht Bilder aus der Befehlszeile der Linux mit den PDFimages aus der Poppler-Utils-Bibliothek wie folgt...

0 Replies

43 Views

Last post by Anonymous
12 Apr 2025, 18:39

Return to “C#”