UnicodeDecodeError: Der Codec „utf-8“ kann Byte 0x89 an Position 270 nicht dekodieren: ungültiges Startbyte

UnicodeDecodeError: Der Codec „utf-8“ kann Byte 0x89 an Position 270 nicht dekodieren: ungültiges Startbyte – Warum? [ge ⇐ Python

1 post • Page 1 of 1

Anonymous

UnicodeDecodeError: Der Codec „utf-8“ kann Byte 0x89 an Position 270 nicht dekodieren: ungültiges Startbyte – Warum? [ge

Report
Quote

Post by Anonymous » 13 Nov 2025, 14:19

Ich mache einen ultraeinfachen Webseiten-Scraper mit Python/Beautifulsoup.
Angesichts einer wichtigen Information, die als PNG-Bild angezeigt wird, musste ich nach PIL/Pytesseract greifen.
Der Code ist extrem einfach und funktioniert, wenn er als mein Benutzer ausgeführt wird. Das Bild wurde zwar geladen, wie der Druckbefehl zeigt, aber image_to_string scheint den Fehler zu erzeugen.

Code: Select all

    encoded_img = 'iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAQAAAC1HAwCAAAAC0lEQVR42mNkYAAAAAYAAjCB0C8AAAAASUVORK5CYII='

# Decode and open as image
img_data = base64.b64decode(encoded_img)
img_bytes = BytesIO(img_data)
img = Image.open(img_bytes)
print(img.format, img.size, img.mode)

# Use pytesseract to extract number
custom_config = r'--psm 7 -c tessedit_char_whitelist=0123456789.,'

return pytesseract.image_to_string(img, config=custom_config).strip()

Wenn ich jedoch eine Cron-Aufgabe ausführe (nachdem Venv und Abhängigkeiten aufgelöst wurden), erhalte ich die unmögliche Meldung aus dem Titel:

Code: Select all

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 270: invalid start byte

Der Versuch, die Umgebungsvariablen LANG oder LC_* festzulegen, hat nicht geholfen.
Ich verwende Python3 und MacOS-Sonoma – ich bin mir nicht sicher, ob das wichtig ist.
Irgendwelche Ideen?

1763039966

Anonymous

Ich mache einen ultraeinfachen Webseiten-Scraper mit Python/Beautifulsoup.
Angesichts einer wichtigen Information, die als PNG-Bild angezeigt wird, musste ich nach PIL/Pytesseract greifen.
Der Code ist extrem einfach und funktioniert, wenn er als mein Benutzer ausgeführt wird. Das Bild wurde zwar geladen, wie der Druckbefehl zeigt, aber image_to_string scheint den Fehler zu erzeugen.
[code]    encoded_img = 'iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAQAAAC1HAwCAAAAC0lEQVR42mNkYAAAAAYAAjCB0C8AAAAASUVORK5CYII='

# Decode and open as image
img_data = base64.b64decode(encoded_img)
img_bytes = BytesIO(img_data)
img = Image.open(img_bytes)
print(img.format, img.size, img.mode)

# Use pytesseract to extract number
custom_config = r'--psm 7 -c tessedit_char_whitelist=0123456789.,'

return pytesseract.image_to_string(img, config=custom_config).strip()
[/code]
Wenn ich jedoch eine Cron-Aufgabe ausführe (nachdem Venv und Abhängigkeiten aufgelöst wurden), erhalte ich die unmögliche Meldung aus dem Titel:
[code]UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 270: invalid start byte[/code]
Der Versuch, die Umgebungsvariablen LANG oder LC_* festzulegen, hat nicht geholfen.
Ich verwende Python3 und MacOS-Sonoma – ich bin mir nicht sicher, ob das wichtig ist.
Irgendwelche Ideen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

UnicodEdeCodeError: 'UTF-8' Codec kann Byte 0xe9 in Position 460 nicht dekodieren: Ungültiges Fortsetzung Byte

Last post by Anonymous « 06 Feb 2025, 09:08
Posted in Python

by Anonymous » 06 Feb 2025, 09:08 » in Python

Ich habe ein Problem mit dem Befehl LoadData meiner Django -App. é Das befindet sich in meiner Datenbanktabelle. oder unterschiedliche Charaktertyp oder Collation -Inaleinstellungen wie C oder...

0 Replies

51 Views

Last post by Anonymous
06 Feb 2025, 09:08
Odoo 18 unter Windows: UnicodEdeCodeError: 'UTF-8' Codec kann Byte 0xe7 beim Serverstart nicht dekodieren

Last post by Anonymous « 18 Aug 2025, 18:47
Posted in Python

by Anonymous » 18 Aug 2025, 18:47 » in Python

Ich richte eine Entwicklungsumgebung für Odoo 18 auf einem Windows -Computer ein. Ich habe das Repository kloniert, eine virtuelle Umgebung (Venv) erstellt und alle Abhängigkeiten von den...

0 Replies

18 Views

Last post by Anonymous
18 Aug 2025, 18:47
Odoo 18 unter Windows: UnicodEdeCodeError: 'UTF-8' Codec kann Byte 0xe7 beim Serverstart nicht dekodieren

Last post by Anonymous « 19 Aug 2025, 12:24
Posted in Python

by Anonymous » 19 Aug 2025, 12:24 » in Python

Ich richte eine Entwicklungsumgebung für Odoo 18 auf einem Windows -Computer ein. Ich habe das Repository kloniert, eine virtuelle Umgebung (Venv) erstellt und alle Abhängigkeiten von den...

0 Replies

15 Views

Last post by Anonymous
19 Aug 2025, 12:24
Versuche, Selenium zu verwenden, aber ich erhalte diesen Fehler: "UnicodEdeCodeError: 'UTF-8' Codec kann Byte 0xa0 in Po

Last post by Anonymous « 24 Feb 2025, 12:24
Posted in Python

by Anonymous » 24 Feb 2025, 12:24 » in Python

Ich bin also neu in Selen und habe nur versucht, einen einfachen Test durchzuführen, um zu sehen, ob es funktioniert hat. Nach der Installation aller erforderlichen Pakete (und dem Umgang mit anderen...

0 Replies

31 Views

Last post by Anonymous
24 Feb 2025, 12:24
So dekodieren Sie den UTF-8-Text aus der Zeitung3k-Bibliothek

Last post by Anonymous « 31 Aug 2025, 13:44
Posted in Python

by Anonymous » 31 Aug 2025, 13:44 » in Python

class ArticleScraper:
def __init__(self):
pass

def articleScraper(self, article_links):
article_content = []
for url in article_links:
url_i = newspaper.Article(url= %s % (url), language='en')...

0 Replies

11 Views

Last post by Anonymous
31 Aug 2025, 13:44

Return to “Python”