Pytesseract kann den Buchstaben A nicht erkennen [geschlossen]

Pytesseract kann den Buchstaben A nicht erkennen [geschlossen] ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Pytesseract kann den Buchstaben A nicht erkennen [geschlossen]

Report
Quote

Post by Anonymous » 22 Dec 2025, 19:24

Ich habe eine Menge Text wie den oben genannten. Im gesamten Text kann Pytesseract den Buchstaben A nicht erkennen. Es erfasst alle anderen Buchstaben um den Buchstaben A, erkennt A jedoch nicht. Hier ist die Ausgabe von Pytesseract:

Code: Select all

FLO-RESTER,DISP,12MM,SPK-LGLOB_L

Das Bild, mit dem ich arbeite, ist ein PDF, das aus einer einzelnen Seite besteht, deren gesamter Inhalt ein Bild ist. Ursprünglich war es ~1700x2000, aber ich habe versucht, es zu verkleinern, was die Situation insofern verbessert, als die Zuverlässigkeit erhöht wird. Allerdings kein Glück mit dem Buchstaben A.

Code: Select all

TESSERACT_CONFIG = r'--psm 4 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789$.-_, '

df = pytesseract.image_to_data(
resized_image,
config=TESSERACT_CONFIG,
lang='eng',
output_type=pytesseract.Output.DATAFRAME
)

Ich verwende psm 4, was, wie ich aus pyimagesearch weiß, für Tabellen/Spalten gedacht ist.

1766427866

Anonymous

[img]https://i.sstatic.net/jfGHDJFd.png[/img]

Ich habe eine Menge Text wie den oben genannten. Im gesamten Text kann Pytesseract den Buchstaben A nicht erkennen. Es erfasst alle anderen Buchstaben um den Buchstaben A, erkennt A jedoch nicht. Hier ist die Ausgabe von Pytesseract:
[code]FLO-RESTER,DISP,12MM,SPK-LGLOB_L
[/code]
Das Bild, mit dem ich arbeite, ist ein PDF, das aus einer einzelnen Seite besteht, deren gesamter Inhalt ein Bild ist. Ursprünglich war es ~1700x2000, aber ich habe versucht, es zu verkleinern, was die Situation insofern verbessert, als die Zuverlässigkeit erhöht wird. Allerdings kein Glück mit dem Buchstaben A.
[code]TESSERACT_CONFIG = r'--psm 4 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789$.-_, '

df = pytesseract.image_to_data(
resized_image,
config=TESSERACT_CONFIG,
lang='eng',
output_type=pytesseract.Output.DATAFRAME
)
[/code]
Ich verwende psm 4, was, wie ich aus pyimagesearch weiß, für Tabellen/Spalten gedacht ist.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Warum sind Buchstaben M oder W -Einzug anders als andere Buchstaben?

Last post by Anonymous « 12 Apr 2025, 15:50
Posted in HTML

by Anonymous » 12 Apr 2025, 15:50 » in HTML

Nach diesem Beispiel suchen:

html

L

M

W

J

V

CSS

/* Base for label styling */
:not(:checked),
:checked {
position: absolute!important;
left: -9999px!important;
}
:not(:checked)...

0 Replies

53 Views

Last post by Anonymous
12 Apr 2025, 15:50
Warum sind Buchstaben M oder W -Einzug anders als andere Buchstaben?

Last post by Anonymous « 12 Apr 2025, 15:50
Posted in CSS

by Anonymous » 12 Apr 2025, 15:50 » in CSS

Nach diesem Beispiel suchen:

html

L

M

W

J

V

CSS

/* Base for label styling */
:not(:checked),
:checked {
position: absolute!important;
left: -9999px!important;
}
:not(:checked)...

0 Replies

39 Views

Last post by Anonymous
12 Apr 2025, 15:50
Kann den persischen/farsi -Text nicht aus dem Bild in Python mit Pytesseract extrahieren

Last post by Anonymous « 03 Jun 2025, 10:05
Posted in Python

by Anonymous » 03 Jun 2025, 10:05 » in Python

Ich verwende PytSeract zum Extrahieren des persischen Textes aus dem Bild, aber ich bekomme nichts! import cv2
import pytesseract
from unidecode import unidecode...

0 Replies

23 Views

Last post by Anonymous
03 Jun 2025, 10:05
Wie man mit Pytesseract gute OCR -Ergebnisse erzielt

Last post by Anonymous « 23 May 2025, 01:49
Posted in Python

by Anonymous » 23 May 2025, 01:49 » in Python

Ich versuche, die Daten aus diesem Bild herauszuholen:

und egal was ich versuchte. CV2
Ich habe das vielversprechendste Ergebnis mit CV2 und adaptivem Schellholz erhalten:
gray =...

0 Replies

13 Views

Last post by Anonymous
23 May 2025, 01:49
Polaren – Ersetzen Sie den Buchstaben in der Zeichenfolge durch einen Großbuchstaben

Last post by Guest « 15 Jan 2025, 17:19
Posted in Python

by Guest » 15 Jan 2025, 17:19 » in Python

Gibt es in Polarzeichen eine Möglichkeit, Zeichen direkt nach dem _ mithilfe von Regex-Ersetzen durch Großbuchstaben zu ersetzen? Bisher habe ich es mit polars.Expr.map_elements erreicht.
Gibt es...

0 Replies

51 Views

Last post by Guest
15 Jan 2025, 17:19

Return to “Python”