Meine PDF-Datei enthält Gujarati-Text, Englisch, mathematische Formeln und Chemiesymbole. Diese Unicode-Zeichen werden nicht korrekt extrahiert.
Wenn ich Text mit iText7 extrahiere, werden Gujarati-Zeichen durch nicht lesbaren Text ersetzt.
Mein C#-Programm:
using (var pdfReader = new PdfReader(file.OpenReadStream()))
using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){
var sb = new StringBuilder();
for (int page = 1; page
Meine PDF-Datei enthält Gujarati-Text, Englisch, mathematische Formeln und Chemiesymbole. Diese Unicode-Zeichen werden nicht korrekt extrahiert. Wenn ich Text mit iText7 extrahiere, werden Gujarati-Zeichen durch nicht lesbaren Text ersetzt. Mein C#-Programm: [code]using (var pdfReader = new PdfReader(file.OpenReadStream())) using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){ var sb = new StringBuilder(); for (int page = 1; page
Ich muss einen zweistufigen PDF-Signaturprozess unter Verwendung von iText in C#implementieren. /> Eine externe Firma (Firma A) signiert den Hash und gibt die Signatur zurück.public...
Ich verwende ITEXT7, um eine PDF zu generieren. Ich möchte seine Größe beim Schreiben überprüfen, denn wenn es über 20 MB ist, möchte ich sie speichern und die verbleibenden Teile einer neuen PDF...
Mit ITEXT7 verwende ich SignerProperties und SignatureFieldAppearance, um einem digital signierten Dokument ein Signaturfeld hinzuzufügen. Mit der SetContents -Funktion füge ich einen Text und eine...
Ich versuche, JS zu bewerten und von HTML nach PDF mit ITEXT7 in C# zu konvertieren, wobei Selenium WebDrive und Headless Chrome diesem Beispiel folgen. Ich mache dies hauptsächlich, um zu versuchen,...
Ich habe ein PDF, aus dem ich einige Bilder mit C ++ extrahieren möchte. Ich kann leicht Bilder aus der Befehlszeile der Linux mit den PDFimages aus der Poppler-Utils-Bibliothek wie folgt...