Extrahieren Sie alle Bilder in einer DOCX -Datei mit Python

Extrahieren Sie alle Bilder in einer DOCX -Datei mit Python ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Extrahieren Sie alle Bilder in einer DOCX -Datei mit Python

Report
Quote

Post by Anonymous » 29 Apr 2025, 13:16

Ich habe eine DOCX-Datei, die 6-7 Bilder enthält. Ich muss die Extraktion von Bildern aus dieser DOC -Datei automatisieren. Gibt es eine Win32com ms Word -API für dasselbe? Oder eine Bibliothek, die alle Bilder genau darin extrahieren kann?

Code: Select all

from pathlib import Path
from win32com.client import Dispatch

xls = Dispatch("Excel.Application")
doc = Dispatch("Word.Application")

def export_images(fp, prefix="img_", suffix="png"):
""" export all of images(inlineShapes) in the word file.
:param fp: path of word file.
:param prefix: prefix of exported images.
:param suffix: suffix of exported images.
"""

fp = Path(fp)
word = doc.Documents.Open(str(fp.resolve()))
sh = xls.Workbooks.Add()
for idx, s in enumerate(word.inlineShapes, 1):
s.Range.CopyAsPicture()
d = sh.ActiveSheet.ChartObjects().add(0, 0, s.width, s.height)
d.Chart.Paste()
d.Chart.Export(fp.parent / ("%s_%s.%s" % (prefix, idx, suffix))
sh.Close(False)
word.Close(False)
export_images(r"C:\Users\HPO2KOR\Desktop\Work\venv\us2017010202.docx")

Sie können die DOCX -Datei hier herunterladen>

1745925363

Anonymous

Ich habe eine DOCX-Datei, die 6-7 Bilder enthält. Ich muss die Extraktion von Bildern aus dieser DOC -Datei automatisieren. Gibt es eine Win32com  ms Word -API für dasselbe? Oder eine Bibliothek, die alle Bilder genau darin extrahieren kann?[code]from pathlib import Path
from win32com.client import Dispatch

xls = Dispatch("Excel.Application")
doc = Dispatch("Word.Application")

def export_images(fp, prefix="img_", suffix="png"):
""" export all of images(inlineShapes) in the word file.
:param fp: path of word file.
:param prefix: prefix of exported images.
:param suffix: suffix of exported images.
"""

fp = Path(fp)
word = doc.Documents.Open(str(fp.resolve()))
sh = xls.Workbooks.Add()
for idx, s in enumerate(word.inlineShapes, 1):
s.Range.CopyAsPicture()
d = sh.ActiveSheet.ChartObjects().add(0, 0, s.width, s.height)
d.Chart.Paste()
d.Chart.Export(fp.parent / ("%s_%s.%s" % (prefix, idx, suffix))
sh.Close(False)
word.Close(False)
export_images(r"C:\Users\HPO2KOR\Desktop\Work\venv\us2017010202.docx")
[/code]

Sie können die DOCX -Datei hier herunterladen>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann ich sicherstellen, dass Bilder in DOCX -Dateien nicht überlaufen, wenn Bilder in der docx -Datei mithilfe von D

Last post by Anonymous « 27 Feb 2025, 10:51
Posted in Java

by Anonymous » 27 Feb 2025, 10:51 » in Java

Wenn ein Bild zu HTML als IMG -Tag hinzugefügt wird und diese HTML dann mit DOCX4J als Altchunk in eine DOCX -Datei eingebettet wird. Das Bild überläuft die hier gezeigten DOCX-Seitengrenzen:...

0 Replies

66 Views

Last post by Anonymous
27 Feb 2025, 10:51
So extrahieren Sie die Seiteninhalte von Seiten mithilfe von DOCX-Dateien mithilfe der Docle-Bibliothek durch Erkennung

Last post by Anonymous « 23 Feb 2025, 16:19
Posted in Python

by Anonymous » 23 Feb 2025, 16:19 » in Python

Ich habe die Seiten-HTML-Extraktion für PDF-Dateien mithilfe von Docling und PYPDF2 erfolgreich implementiert. Hier ist, was mein aktueller Code für PDFs tut:

verwendet PYPDF2, um PDF in einzelne...

0 Replies

56 Views

Last post by Anonymous
23 Feb 2025, 16:19
Wie kann ich den gesamten Text aus einer .docx-Datei in Python löschen, bevor ich sie erneut hochladen?

Last post by Anonymous « 19 May 2025, 08:30
Posted in Python

by Anonymous » 19 May 2025, 08:30 » in Python

Ich arbeite an einem Fastapi -Backend, in dem Benutzer .docx -Vorlagendateien hochladen können. Diese Vorlagen werden mehrmals wiederverwendet. Bevor ich eine Vorlage neu laden, die zuvor mit...

0 Replies

11 Views

Last post by Anonymous
19 May 2025, 08:30
Aktualisieren Sie meine Python und verwenden Sie die Linien PIP Installieren Sie Flask Flask_Sqlalchemy Python-docx in m

Last post by Anonymous « 10 May 2025, 19:49
Posted in Python

by Anonymous » 10 May 2025, 19:49 » in Python

Wenn ich dies in meinem integrierten Terminal ausführe, sagt es mir, dass es ein Erfolg war, aber es sagt mir auch, dass noch ein Update verfügbar ist, also führe ich es erneut aus und aktualisiere...

0 Replies

22 Views

Last post by Anonymous
10 May 2025, 19:49
Das manuelle Kopieren eines Diagramms von Docx in ein anderes führt zu einer beschädigten Datei

Last post by Guest « 15 Jan 2025, 17:38
Posted in Python

by Guest » 15 Jan 2025, 17:38 » in Python

Ich arbeite an einer Anforderung, Inhalte aus einer DOCX-Datei zu kopieren und an eine andere anzuhängen, aber das Durcheinander beginnt, wenn es um Diagramme geht.
Ich verwende Python- docx, und da...

0 Replies

38 Views

Last post by Guest
15 Jan 2025, 17:38

Return to “Python”