So konvertieren Sie Pfade in einer PDF-Datei in Text

So konvertieren Sie Pfade in einer PDF-Datei in Text ⇐ C#

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

So konvertieren Sie Pfade in einer PDF-Datei in Text

Report
Quote

Post by Anonymous » 12 Nov 2025, 09:05

PDF-Dateien enthalten weder Bilder noch Text. Der auf der Seite sichtbare Text wird als Pfad gerendert.
PdfPig (https://github.com/UglyToad/PdfPig) mit
ausprobiert

Code: Select all

using PdfDocument document = PdfDocument.Open(stream, SkiaRenderingParsingOptions.Instance );
string ptxt = "";
foreach(PdfPath p in page.Paths)
ptxt += p.ToString();
Console.WriteLine(ptxt);

Die Ausgabe ist

UglyToad.PdfPig.Graphics.PdfPath

Wie konvertiert man solche PDF-Dateien in einfachen Text? Wenn eine direkte Konvertierung nicht möglich ist, wie konvertiert man dann ein PDF in ein Bild, um es an OCR weiterzugeben?
PDFs können auch Textobjekte enthalten, aus denen Text direkt extrahiert werden kann.
PdfPig stellt eine Paths-Sammlung bereit, mit der jedes Path-Objekt abgerufen werden kann.
Wie konvertiert man jedes Path-Objekt in ein Bild? Der Quellcode des PDF Viewers sollte dies enthalten.
Wie verwende ich OpenCv oder SkiaSharp für diese Konvertierung?
Dies ist eine .NET 9 ASP.NET MVC-Anwendung.

1762934742

Anonymous

PDF-Dateien enthalten weder Bilder noch Text. Der auf der Seite sichtbare Text wird als Pfad gerendert.
PdfPig (https://github.com/UglyToad/PdfPig) mit
ausprobiert[code]using PdfDocument document = PdfDocument.Open(stream, SkiaRenderingParsingOptions.Instance );
string ptxt = "";
foreach(PdfPath p in page.Paths)
ptxt += p.ToString();
Console.WriteLine(ptxt);
[/code]
Die Ausgabe ist

UglyToad.PdfPig.Graphics.PdfPath

Wie konvertiert man solche PDF-Dateien in einfachen Text? Wenn eine direkte Konvertierung nicht möglich ist, wie konvertiert man dann ein PDF in ein Bild, um es an OCR weiterzugeben?
PDFs können auch Textobjekte enthalten, aus denen Text direkt extrahiert werden kann.
PdfPig stellt eine Paths-Sammlung bereit, mit der jedes Path-Objekt abgerufen werden kann.
Wie konvertiert man jedes Path-Objekt in ein Bild? Der Quellcode des PDF Viewers sollte dies enthalten.
Wie verwende ich OpenCv oder SkiaSharp für diese Konvertierung?
Dies ist eine .NET 9 ASP.NET MVC-Anwendung.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

So konvertieren Sie Pfade in einer PDF-Datei in Text

Last post by Anonymous « 10 Nov 2025, 22:46
Posted in C#

by Anonymous » 10 Nov 2025, 22:46 » in C#

PDF-Dateien (Beispiel enthalten weder Bilder noch Text. Der auf der Seite sichtbare Text wird als Pfad gerendert.
PdfPig ( mit
ausprobiert using PdfDocument document = PdfDocument.Open(stream,...

0 Replies

29 Views

Last post by Anonymous
10 Nov 2025, 22:46
Links, CSS und Icon erfordern absolute Pfade in HTML (relative Pfade funktionieren nicht)

Last post by Anonymous « 02 Mar 2025, 12:43
Posted in HTML

by Anonymous » 02 Mar 2025, 12:43 » in HTML

Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während:

Die HTML -Datei mit diesem Link...

0 Replies

73 Views

Last post by Anonymous
02 Mar 2025, 12:43
Links, CSS und Icon erfordern absolute Pfade in HTML (relative Pfade funktionieren nicht)

Last post by Anonymous « 02 Mar 2025, 12:43
Posted in CSS

by Anonymous » 02 Mar 2025, 12:43 » in CSS

Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während:

Die HTML -Datei mit diesem Link...

0 Replies

69 Views

Last post by Anonymous
02 Mar 2025, 12:43
Links, CSS und Icon erfordern absolute Pfade in HTML (relative Pfade funktionieren nicht)

Last post by Anonymous « 02 Mar 2025, 23:27
Posted in HTML

by Anonymous » 02 Mar 2025, 23:27 » in HTML

Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während:

Die HTML -Datei mit diesem Link...

0 Replies

84 Views

Last post by Anonymous
02 Mar 2025, 23:27
Links, CSS und Icon erfordern absolute Pfade in HTML (relative Pfade funktionieren nicht)

Last post by Anonymous « 02 Mar 2025, 23:27
Posted in CSS

by Anonymous » 02 Mar 2025, 23:27 » in CSS

Ich bin mir bewusst, dass meine Frage ein Grundlagen ist, aber ich habe immer noch Probleme. Your file couldn’t be accessed - ERR_FILE_NOT_FOUND Fehler) Während:

Die HTML -Datei mit diesem Link...

0 Replies

57 Views

Last post by Anonymous
02 Mar 2025, 23:27

Return to “C#”