Wie gehe ich mit OCR um, wenn gescannte PDF -Seiten aufgrund eines schlechten Scans oder einer Dachrinne Teile der vorhePython

Python-Programme
Anonymous
 Wie gehe ich mit OCR um, wenn gescannte PDF -Seiten aufgrund eines schlechten Scans oder einer Dachrinne Teile der vorhe

Post by Anonymous »

Ich veriere mich mit einer großen Stapel von gescanntem Buch PDFs mit einer OCR -Pipeline (Mineru, Paddleocal usw.). Dies ist wahrscheinlich auf Buchrinne, schlechte Ausrichtung oder Seitenaufteilung während des Scannens zurückzuführen. Hier wird < /p>
OCR- und Layout -Modelle einstellen. Tools oder Skripte für die Batch-Verarbeitung solcher PDFs, um dieses Problem zu beheben?

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post