Ich arbeite an der OCR-Verarbeitung für bildbasierte PDF-Dateien mit der Google Vision-API in einer Python 3.11.4-Umgebung. Ich bin jedoch in ein Problem stoße, bei dem eine einzelne Zelle, die Multi-Line-Text enthält, basierend auf der Y-Koordinate in separate Textblöcke aufgeteilt wird. Dies führt dazu, dass die Reihenfolge des Inhalts während der Rekonstruktion falsch ausgerichtet wird.Manufactured Dataline_1 Address Dataline_2 Dataline_3
< /code>
aktuelles OCR -Ergebnis: < /p>
Dataline_2 MAnufactured Dataline_1 Address Dataline_3
< /code>
Wie kann ich Multi-Line-Text in einer einzelnen Zelle effektiv rekonstruieren, wenn ich ihn in verschiedene Blöcke aufteilt?>
Wie fusioniere ich geteilte Textblöcke aus Multi-Line-Zellen in der OCR-Tabelle? ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post