Python LXML und eine Tabelle aus dem Word -Dokument erhalten
Posted: 10 Apr 2025, 06:35
Ich arbeite daran, einige Informationen aus dem Word -Dokument zu ziehen. Ich habe mehrere Tabellen und möchte eine bestimmte Tabelle erhalten, die in dem Dokument, das durch eine bestimmte [x] -Kennung verwiesen wird, keinen bestimmten Ort enthält. Ich muss danach suchen.
So erhalten Sie auf dieser Suche dieses /w: TBL Element, das ich iterieren kann?
Code: Select all
import lxml.etree
root = lxml.etree.parse("document.xml")
element=root.xpath(".//*[contains(text(), 'some_searched_text')]")
< /code>
Das findet mich eine Daten in einem Dokument, aber ich erhalte nur 1 Element in der Elementvariablen und kann in dieser Tabelle, in der sich dieser Text befindet, nicht auf andere Elemente zugreifen. Ich muss diesen anderen Text aus der Tabelle extrahieren, wenn sich slow_searched_text befindet. Wie bekomme ich XPath von der Position, die Element Variable, mit der ich arbeiten kann?
...
...
categories
Opis
Jakis
sobie
description of my tasks
some_searched_text
some random text and description that i want to extract from this table
this is the other text that I want to pull out
KAT1
Code: Select all
table=element.getpartent()
< /code>
Dann erhalte ich ein Fehler in diesem Fall, der < /p>
sagtAttributeError: 'list' object has no attribute 'getpartent