Einlesen von XML-Daten in Python

Einlesen von XML-Daten in Python ⇐ Python

1 post • Page 1 of 1

Anonymous

Report
Quote

Post by Anonymous » 03 Jan 2026, 06:23

Ich suche Hilfe bei der Konvertierung der folgenden XML-Daten in einen Datenrahmen.
Ich habe es geschafft, einen funktionierenden Code in R zu schreiben (XML-Paket, Code ist chaotisch), aber dann wurde mir klar, dass es in Python vielleicht noch einfacher ist. Ich habe aus meinem ursprünglichen Datensatz einige gefälschte Daten generiert und mit dem folgenden Code herumgespielt. Bitte beachten Sie, dass meine Originaldaten viel größer sind (mehr als 1000 Einträge). Wie Sie sehen können, gibt es am Anfang und am Ende einige Daten, die nicht zum Hauptteil der Daten gehören. Der Code funktioniert gut für diese synthetisierten kleineren Daten, aber als ich meine Originaldaten eingegeben habe, wurde mir immer wieder die folgende Fehlermeldung angezeigt. Ich würde mich wirklich über jede Hilfe freuen.

Code: Select all

import xml.etree.ElementTree as ET
import pandas as pd

# Parse XML file
tree = ET.parse("/mnt/data/pasted.txt")
root = tree.getroot()

# -------------------------
# 1. Extract column names
# -------------------------
headers = []
header_node = root.find("header")

for item in header_node.findall("item"):
headers.append(item.get("name"))

# -------------------------
# 2. Extract row data
# -------------------------
rows = []
data_node = root.find("data")

for row in data_node.findall("row"):
row_values = []
for value in row.findall("value"):
# Handle xs:nil="true"
if value.attrib.get("{http://www.w3.org/2001/XMLSchema-instance}nil") == "true":
row_values.append(None)
else:
row_values.append(value.text)
rows.append(row_values)

# -------------------------
# 3.  Create DataFrame
# -------------------------
df = pd.DataFrame(rows, columns=headers)

# View result
print(df)

Code: Select all



















summary


















previous total
15

















current total
25

















type


















total
25

















A1
M
1980-03-12
45
Red Orange

2000-01-19
20002-01-02
21

2000-01-03
2020-01-13
13



-0.50


A2
M
1975-07-05
50
Stony Rock

1999-01-10



1980-10-01
2000-01-12
30



3





RND
error

















weight
weight change

















---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
Cell In[9], line 14
11 headers = []
12 header_node = root.find("header")
---> 14 for item in header_node.findall("item"):
15     headers.append(item.get("name"))
17 # -------------------------
18 # 2. Extract row data
19 # -------------------------

AttributeError: 'NoneType' object has no attribute 'findall'

1767417786

Anonymous

Ich suche Hilfe bei der Konvertierung der folgenden XML-Daten in einen Datenrahmen.
Ich habe es geschafft, einen funktionierenden Code in R zu schreiben (XML-Paket, Code ist chaotisch), aber dann wurde mir klar, dass es in Python vielleicht noch einfacher ist. Ich habe aus meinem ursprünglichen Datensatz einige gefälschte Daten generiert und mit dem folgenden Code herumgespielt. Bitte beachten Sie, dass meine Originaldaten viel größer sind (mehr als 1000 Einträge). Wie Sie sehen können, gibt es am Anfang und am Ende einige Daten, die nicht zum Hauptteil der Daten gehören. Der Code funktioniert gut für diese synthetisierten kleineren Daten, aber als ich meine Originaldaten eingegeben habe, wurde mir immer wieder die folgende Fehlermeldung angezeigt. Ich würde mich wirklich über jede Hilfe freuen.
[code]import xml.etree.ElementTree as ET
import pandas as pd

# Parse XML file
tree = ET.parse("/mnt/data/pasted.txt")
root = tree.getroot()

# -------------------------
# 1. Extract column names
# -------------------------
headers = []
header_node = root.find("header")

for item in header_node.findall("item"):
headers.append(item.get("name"))

# -------------------------
# 2. Extract row data
# -------------------------
rows = []
data_node = root.find("data")

for row in data_node.findall("row"):
row_values = []
for value in row.findall("value"):
# Handle xs:nil="true"
if value.attrib.get("{http://www.w3.org/2001/XMLSchema-instance}nil") == "true":
row_values.append(None)
else:
row_values.append(value.text)
rows.append(row_values)

# -------------------------
# 3.  Create DataFrame
# -------------------------
df = pd.DataFrame(rows, columns=headers)

# View result
print(df)
[/code]
[code]


















summary


















previous total
15

















current total
25

















type


















total
25

















A1
M
1980-03-12
45
Red Orange

2000-01-19
20002-01-02
21

2000-01-03
2020-01-13
13



-0.50


A2
M
1975-07-05
50
Stony Rock

1999-01-10



1980-10-01
2000-01-12
30



3





RND
error

















weight
weight change

















---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
Cell In[9], line 14
11 headers = []
12 header_node = root.find("header")
---> 14 for item in header_node.findall("item"):
15     headers.append(item.get("name"))
17 # -------------------------
18 # 2. Extract row data
19 # -------------------------

AttributeError: 'NoneType' object has no attribute 'findall'
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Einlesen von XML-Daten in Python

Last post by Anonymous « 04 Jan 2026, 21:59
Posted in Python

by Anonymous » 04 Jan 2026, 21:59 » in Python

Ich suche Hilfe bei der Konvertierung der folgenden XML-Daten in einen Datenrahmen.
Ich habe es geschafft, einen funktionierenden Code in R (XML-Paket, Code ist chaotisch) zu schreiben, aber dann...

0 Replies

1 Views

Last post by Anonymous
04 Jan 2026, 21:59
Einlesen von XML-Daten in Python

Last post by Anonymous « 05 Jan 2026, 13:07
Posted in Python

by Anonymous » 05 Jan 2026, 13:07 » in Python

Ich suche Hilfe bei der Konvertierung der folgenden XML-Daten in einen Datenrahmen.
Ich habe es geschafft, einen funktionierenden Code in R (XML-Paket, Code ist chaotisch) zu schreiben, aber dann...

0 Replies

0 Views

Last post by Anonymous
05 Jan 2026, 13:07
Einlesen von XML-Daten in Python

Last post by Anonymous « 05 Jan 2026, 18:47
Posted in Python

by Anonymous » 05 Jan 2026, 18:47 » in Python

Ich suche Hilfe bei der Konvertierung der folgenden XML-Daten in einen Datenrahmen.
Ich habe es geschafft, einen funktionierenden Code in R (XML-Paket, Code ist chaotisch) zu schreiben, aber dann...

0 Replies

1 Views

Last post by Anonymous
05 Jan 2026, 18:47
Wie kann ich eine in einer CSV-Datei gespeicherte Sparse-Matrix einlesen? (Python 3.6.4)

Last post by Anonymous « 04 Dec 2025, 07:32
Posted in Python

by Anonymous » 04 Dec 2025, 07:32 » in Python

Mit countvectorizer habe ich Feature-Vektoren aus Tausenden von E-Mails extrahiert und in einer CSV-Datei gespeichert
dictionary = open (r'''C:\Users\User\Desktop\csmp3\stemmedDictionary.txt''', r...

0 Replies

21 Views

Last post by Anonymous
04 Dec 2025, 07:32
Java- oder Python-Methode zum Extrahieren eines Sub-XML aus großem XML, abhängig von untergeordneten Textknoten

Last post by Guest « 13 Jan 2025, 19:38
Posted in Java

by Guest » 13 Jan 2025, 19:38 » in Java

Ich muss eine große XML-Datei verarbeiten. Ich muss alle „Situations“-TAGS extrahieren, wenn diese A-52 haben , AP-9 or A-55`-Werte in ihren, da ich den Rest des XML nicht benötige. Erstellen Sie...

0 Replies

42 Views

Last post by Guest
13 Jan 2025, 19:38

Return to “Python”