Pytesseract kann den Buchstaben A nicht erkennen [geschlossen]Python

Python-Programme
Anonymous
 Pytesseract kann den Buchstaben A nicht erkennen [geschlossen]

Post by Anonymous »

Image

Ich habe eine Menge Text wie den oben genannten. Im gesamten Text kann Pytesseract den Buchstaben A nicht erkennen. Es erfasst alle anderen Buchstaben um den Buchstaben A, erkennt A jedoch nicht. Hier ist die Ausgabe von Pytesseract:

Code: Select all

FLO-RESTER,DISP,12MM,SPK-LGLOB_L
Das Bild, mit dem ich arbeite, ist ein PDF, das aus einer einzelnen Seite besteht, deren gesamter Inhalt ein Bild ist. Ursprünglich war es ~1700x2000, aber ich habe versucht, es zu verkleinern, was die Situation insofern verbessert, als die Zuverlässigkeit erhöht wird. Allerdings kein Glück mit dem Buchstaben A.

Code: Select all

TESSERACT_CONFIG = r'--psm 4 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789$.-_, '

df = pytesseract.image_to_data(
resized_image,
config=TESSERACT_CONFIG,
lang='eng',
output_type=pytesseract.Output.DATAFRAME
)
Ich verwende psm 4, was, wie ich aus pyimagesearch weiß, für Tabellen/Spalten gedacht ist.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post