using PdfDocument document = PdfDocument.Open(stream, SkiaRenderingParsingOptions.Instance );
string ptxt = "";
foreach(PdfPath p in page.Paths)
ptxt += p.ToString();
Console.WriteLine(ptxt);
Die Ausgabe ist
UglyToad.PdfPig.Graphics.PdfPath
Wie konvertiert man solche PDF-Dateien in einfachen Text? Wenn eine direkte Konvertierung nicht möglich ist, wie konvertiert man PDF in ein Bild, um es an OCR weiterzugeben?
Dies ist eine .NET 9 ASP.NET MVC-Anwendung.
PDF-Dateien (Beispiel https://github.com/user-attachments/files/23436471/stainlessproff.pdf) enthalten weder Bilder noch Text. Der auf der Seite sichtbare Text wird als Pfad gerendert. PdfPig (https://github.com/UglyToad/PdfPig) mit ausprobiert[code]using PdfDocument document = PdfDocument.Open(stream, SkiaRenderingParsingOptions.Instance ); string ptxt = ""; foreach(PdfPath p in page.Paths) ptxt += p.ToString(); Console.WriteLine(ptxt); [/code] Die Ausgabe ist
UglyToad.PdfPig.Graphics.PdfPath
Wie konvertiert man solche PDF-Dateien in einfachen Text? Wenn eine direkte Konvertierung nicht möglich ist, wie konvertiert man PDF in ein Bild, um es an OCR weiterzugeben? Dies ist eine .NET 9 ASP.NET MVC-Anwendung.
PDF-Dateien enthalten weder Bilder noch Text. Der auf der Seite sichtbare Text wird als Pfad gerendert.
PdfPig ( mit
ausprobiert using PdfDocument document = PdfDocument.Open(stream,...
Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während:
Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während:
Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während:
Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während: