Bei den meisten textbasierten PDFs funktioniert das gut, aber bei einigen gescannten, nur Bild-PDFs wird der Speicherverbrauch extrem hoch.
Metriken
Problembeschreibung
- PDF: 1 Seite, gescannt Rechnung
/>
Frage
Aus technischer und architektonischer Sicht:- Ist es sinnvoll, weiterhin Java + PDFBox zu verwenden und zu versuchen, die Speichernutzung weiter zu optimieren?
- Oder ist Python + PyMuPDF grundsätzlich besser für gescannte/bildlastige PDFs geeignet?
- Wenn es sinnvoll ist, einen Python-basierten Dokument-Rendering-Dienst einzuführen stattdessen
Mobile version