Wie fusioniere ich geteilte Textblöcke aus Multi-Line-Zellen in der OCR-Tabelle?Python

Python-Programme
Anonymous
 Wie fusioniere ich geteilte Textblöcke aus Multi-Line-Zellen in der OCR-Tabelle?

Post by Anonymous »

Ich arbeite an der OCR-Verarbeitung für bildbasierte PDF-Dateien mit der Google Vision-API in einer Python 3.11.4-Umgebung. Ich bin jedoch in ein Problem stoße, bei dem eine einzelne Zelle, die Multi-Line-Text enthält, basierend auf der Y-Koordinate in separate Textblöcke aufgeteilt wird. Dies führt dazu, dass die Reihenfolge des Inhalts während der Rekonstruktion falsch ausgerichtet wird.Manufactured Dataline_1 Address Dataline_2 Dataline_3
< /code>
aktuelles OCR -Ergebnis: < /p>
Dataline_2 MAnufactured Dataline_1 Address Dataline_3
< /code>
Wie kann ich Multi-Line-Text in einer einzelnen Zelle effektiv rekonstruieren, wenn ich ihn in verschiedene Blöcke aufteilt?>

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post