Ich veriere mich mit einer großen Stapel von gescanntem Buch PDFs mit einer OCR -Pipeline (Mineru, Paddleocal usw.). Dies ist wahrscheinlich auf Buchrinne, schlechte Ausrichtung oder Seitenaufteilung während des Scannens zurückzuführen. Hier wird < /p>
OCR- und Layout -Modelle einstellen. Tools oder Skripte für die Batch-Verarbeitung solcher PDFs, um dieses Problem zu beheben?
Wie gehe ich mit OCR um, wenn gescannte PDF -Seiten aufgrund eines schlechten Scans oder einer Dachrinne Teile der vorhe ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post