Ich arbeite mit Bildern, die handgeschriebene Ziffern und Buchstaben 'x' enthalten (was bedeutet, dass dieses Feld als „leer“ angesehen werden sollte), in denen jedes Zeichen in einer gepunkteten Box geschrieben ist. Ich versuche, diese gepunkteten Kisten um die Charaktere für späteres OCR zu entfernen. Zusätzliches Problem ist, dass die Bilder von unterschiedlicher Qualität sind und diese gepunkteten Linien ziemlich häufig in feste verschmelzen. Ich habe versucht, nur Zeichen zu isolieren, die sich meistens mit diesen Kästchen überlappen, aber nirgendwo hingewiesen wurden. Python und opencv): < /p>
graucale < /li>
otsu < /li>
ERODE & DILLATET < /li>
Es sollte nur 4 Zeichen übrig bleiben. Erosionsfiguren werden ebenfalls erodiert. Ich habe auch versucht, Bilder und Zeichnungsboxen zu verdunkeln, indem ich horizontale und vertikale Linien erfasst und sie danach entfernt habe. Da sich viele Zeichen entweder mit der Box überlappen oder darüber hinausgehen, hat auch dieser Ansatz zu ziemlich fragwürdigen Ergebnissen geführt.
So entfernen Sie gepunktete Grenzboxen und erhalten Sie handgeschriebene Ziffern/Zeichen für OCR ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post