Bild zu Text - Entfernen Sie Nicht -ASCII -Zeichen in Python 2.7
Posted: 17 Aug 2025, 17:48
Ich benutze Pytesser, um ein kleines Bild zu ocr und eine Zeichenfolge daraus zu erhalten: < /p>
image= Image.open(ImagePath)
text = image_to_string(image)
print text
< /code>
Der Pytesser liebt es jedoch, nicht-ASCII-Zeichen manchmal zu erkennen und zurückzugeben. Das Problem tritt auf, wenn ich jetzt das drucken möchte, was ich gerade erkannt habe. In Python 2.7 (was ich verwende) stürzt das Programm ab. Vielleicht gibt es etwas, das Sie in Tesseract OCR ändern können? < /p>
Oder gibt es eine Möglichkeit, eine Zeichenfolge für Nicht-ASCII-Zeichen zu testen (ohne das Programm zu stürzen) und dann einfach nicht diese Linie zu drucken?>
image= Image.open(ImagePath)
text = image_to_string(image)
print text
< /code>
Der Pytesser liebt es jedoch, nicht-ASCII-Zeichen manchmal zu erkennen und zurückzugeben. Das Problem tritt auf, wenn ich jetzt das drucken möchte, was ich gerade erkannt habe. In Python 2.7 (was ich verwende) stürzt das Programm ab. Vielleicht gibt es etwas, das Sie in Tesseract OCR ändern können? < /p>
Oder gibt es eine Möglichkeit, eine Zeichenfolge für Nicht-ASCII-Zeichen zu testen (ohne das Programm zu stürzen) und dann einfach nicht diese Linie zu drucken?>