Entfernen Sie Hintergrundtext und Rauschen aus einem Bild mithilfe der Bildverarbeitung mit OpenCV

Entfernen Sie Hintergrundtext und Rauschen aus einem Bild mithilfe der Bildverarbeitung mit OpenCV ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Entfernen Sie Hintergrundtext und Rauschen aus einem Bild mithilfe der Bildverarbeitung mit OpenCV

Post by Guest » 17 Jan 2025, 07:13

Ich habe diese Bilder

Wofür ich den Text im entfernen möchte Hintergrund. Es sollten nur die Captcha-Zeichen übrig bleiben (d. h. K6PwKA, YabVzu). Die Aufgabe besteht darin, diese Zeichen später mit Tesseract zu identifizieren.

Das habe ich versucht, aber es liefert keine sehr gute Genauigkeit.

Code: Select all

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Users\HPO2KOR\AppData\Local\Tesseract-OCR\tesseract.exe"
img = cv2.imread("untitled.png")
gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray_filtered = cv2.inRange(gray_image, 0, 75)
cv2.imwrite("cleaned.png", gray_filtered)

Wie kann ich das Gleiche verbessern?

Hinweis:
Ich habe alle Vorschläge ausprobiert, die ich für diese Frage bekam, aber keiner davon hat für mich funktioniert.

BEARBEITEN:
Gemäß Elias, ich habe versucht, die Farbe des Captcha-Textes mit Photoshop zu finden, indem ich ihn in Graustufen konvertiert habe Es stellte sich heraus, dass es irgendwo zwischen [100, 105] lag. Anschließend bewerte ich das Bild anhand dieses Bereichs. Aber das Ergebnis, das ich mit Tesseract erhalten habe, lieferte kein zufriedenstellendes Ergebnis.

Code: Select all

gray_filtered = cv2.inRange(gray_image, 100, 105)
cv2.imwrite("cleaned.png", gray_filtered)
gray_inv = ~gray_filtered
cv2.imwrite("cleaned.png", gray_inv)
data = pytesseract.image_to_string(gray_inv, lang='eng')

Ausgabe:

Code: Select all

'KEP wKA'

Ergebnis:

[img]https://i .sstatic.net/AqYeO.png[/img]

BEARBEITEN 2:

Code: Select all

def get_text(img_name):
lower = (100, 100, 100)
upper = (104, 104, 104)
img = cv2.imread(img_name)
img_rgb_inrange = cv2.inRange(img, lower, upper)
neg_rgb_image = ~img_rgb_inrange
cv2.imwrite('neg_img_rgb_inrange.png', neg_rgb_image)
data = pytesseract.image_to_string(neg_rgb_image, lang='eng')
return data

ergibt:

[img]https://i .sstatic.net/rSrSz.png[/img]

und der Text als

Code: Select all

GXuMuUZ

Gibt es eine Möglichkeit, es etwas weicher zu machen?

1737094406

Guest

Ich habe diese Bilder

[img]https://i.sstatic.net/VOfgD.png[/img]


[img]https://i.sstatic.net/TdRKg.png[/img]

Wofür ich den Text im entfernen möchte Hintergrund. Es sollten nur die Captcha-Zeichen übrig bleiben (d. h. K6PwKA, YabVzu). Die Aufgabe besteht darin, diese Zeichen später mit Tesseract zu identifizieren.

Das habe ich versucht, aber es liefert keine sehr gute Genauigkeit.

[code]import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Users\HPO2KOR\AppData\Local\Tesseract-OCR\tesseract.exe"
img = cv2.imread("untitled.png")
gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray_filtered = cv2.inRange(gray_image, 0, 75)
cv2.imwrite("cleaned.png", gray_filtered)
[/code]

Wie kann ich das Gleiche verbessern?

[b]Hinweis:[/b]
Ich habe alle Vorschläge ausprobiert, die ich für diese Frage bekam, aber keiner davon hat für mich funktioniert.

[b]BEARBEITEN:[/b]
Gemäß Elias, ich habe versucht, die Farbe des Captcha-Textes mit Photoshop zu finden, indem ich ihn in Graustufen konvertiert habe Es stellte sich heraus, dass es irgendwo zwischen [100, 105] lag. Anschließend bewerte ich das Bild anhand dieses Bereichs. Aber das Ergebnis, das ich mit Tesseract erhalten habe, lieferte kein zufriedenstellendes Ergebnis.

[code]gray_filtered = cv2.inRange(gray_image, 100, 105)
cv2.imwrite("cleaned.png", gray_filtered)
gray_inv = ~gray_filtered
cv2.imwrite("cleaned.png", gray_inv)
data = pytesseract.image_to_string(gray_inv, lang='eng')
[/code]

Ausgabe:

[code]'KEP wKA'
[/code]

Ergebnis: 

[img]https://i .sstatic.net/AqYeO.png[/img]


[b]BEARBEITEN 2:[/b]

[code]def get_text(img_name):
lower = (100, 100, 100)
upper = (104, 104, 104)
img = cv2.imread(img_name)
img_rgb_inrange = cv2.inRange(img, lower, upper)
neg_rgb_image = ~img_rgb_inrange
cv2.imwrite('neg_img_rgb_inrange.png', neg_rgb_image)
data = pytesseract.image_to_string(neg_rgb_image, lang='eng')
return data
[/code]

ergibt: 

[img]https://i .sstatic.net/rSrSz.png[/img]


und der Text als

[code]GXuMuUZ
[/code]

Gibt es eine Möglichkeit, es etwas weicher zu machen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Entfernen von vertikalem periodisches Rauschen in einem Bild mit FFT [geschlossen]

Last post by Anonymous « 05 Apr 2025, 12:15
Posted in Python

by Anonymous » 05 Apr 2025, 12:15 » in Python

Ich habe versucht, das Geräusch mit vertikalem Rauschen zu entfernen. Ich habe versucht, die Bilder in die Raumdomäne zu transformieren, aber manuell die Filter einzustellen, um ein gutes Ergebnis...

0 Replies

3 Views

Last post by Anonymous
05 Apr 2025, 12:15
Robustere Bildverarbeitung für das Finden von Teilen in der Kameraansicht mit OpenCV? [geschlossen]

Last post by Anonymous « 05 Apr 2025, 11:00
Posted in Python

by Anonymous » 05 Apr 2025, 11:00 » in Python

Ich versuche, Teile in einem Tablett zu zählen. Sie sind eindeutig schwarz gegen einen Karton -farbige Box, also habe ich das Histogramm angesehen und ein binäres Bild basierend auf einem Prozentsatz...

0 Replies

4 Views

Last post by Anonymous
05 Apr 2025, 11:00
Ermitteln von Vorsprüngen und Vertiefungen auf einer Braille-Seite mithilfe der Bildverarbeitung

Last post by Guest « 06 Jan 2025, 22:39
Posted in Python

by Guest » 06 Jan 2025, 22:39 » in Python

Wie kann ich das Problem der Erkennung von Vorsprüngen und Vertiefungen auf einer Braille-Seite angehen? Das ist ziemlich schwierig, denn wenn sich die Lichtquelle auf der rechten Seite der Seite...

0 Replies

9 Views

Last post by Guest
06 Jan 2025, 22:39
Ernte vom Bild mit OpenCV ohne Einbeziehung von Grün - OpenCV & Python

Last post by Anonymous « 10 Apr 2025, 13:39
Posted in Python

by Anonymous » 10 Apr 2025, 13:39 » in Python

begann kürzlich mit der Entwicklung einer grundlegenden ANPR -Anwendung mit OpenCV und Pytesseract. Die Gesamtkonturierung und das Zuschneiden scheint zu funktionieren, aber es gibt ein eklatantes...

0 Replies

13 Views

Last post by Anonymous
10 Apr 2025, 13:39
Die Verwendung von swr_convert zum Wiederverhalten von Audio -Rahmen führte zu Audio mit erheblichen Rauschen

Last post by Guest « 14 Feb 2025, 04:51
Posted in C++

by Guest » 14 Feb 2025, 04:51 » in C++

Ich habe versucht, SWR_Convert zu verwenden, um Audio -Frames von 44100 Hz auf 16000 Hz wiederzuproben und die Frames einzeln für Testzwecke zu verarbeiten. Das resultierende Audio scheint jedoch mit...

0 Replies

8 Views

Last post by Guest
14 Feb 2025, 04:51

Return to “Python”