Wie kann man mit Python und Pandas die Header in einem Bank -Erklärung CSV/Excel dynamisch umbenennen? - Programmiererforum

Wie kann man mit Python und Pandas die Header in einem Bank -Erklärung CSV/Excel dynamisch umbenennen? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie kann man mit Python und Pandas die Header in einem Bank -Erklärung CSV/Excel dynamisch umbenennen?

Report
Quote

Post by Anonymous » 21 Aug 2025, 22:39

Ich habe Bankaussagen sowohl in Excel- als auch in CSV -Formaten. Die Header können je nach Bank oder Dateixport geringfügig variieren, zum Beispiel: < /p>

Code: Select all

TRAN_DATE, CHQNO, PARTICULARS, DR, CR, BAL, SOL
< /code>
Ich möchte diese Spaltennamen auf konsistente Namen wie: < /p>
normalisieren.{
"TRAN_DATE": "transaction_date",
"DR": "debit_amount",
"CR": "credit_amount",
"PARTICULARS": "narration",
"CHQNO": "cheque_no",
...
}
< /code>
Ich habe eine Funktion geschrieben, um die Header -Zeile dynamisch zu erkennen: < /p>
def detect_header(self, df_raw, min_match=2, min_cols=3, max_scan=200):
normalized_mapping = {self.normalize_header(k): v for k, v in COLUMN_MAPPING.items()}
valid_headers = set(normalized_mapping.keys())

df_raw = df_raw.fillna("")

for idx in range(min(len(df_raw), max_scan)):
row = df_raw.iloc[idx].tolist()
split_row = []
for c in row:
if isinstance(c, str) and "," in c:
split_row.extend([x.strip() for x in c.split(",") if x.strip()])
elif isinstance(c, str) and c.strip():
split_row.append(c.strip())

values = [self.normalize_header(c) for c in split_row]
matches = [v for v in values if v in valid_headers]

if len(matches) >= 4:
new_cols = [normalized_mapping.get(self.normalize_header(c), c) for c in split_row]
df = df_raw.iloc[idx+1:].reset_index(drop=True)
if len(df.columns) < len(new_cols):
for i in range(len(new_cols) - len(df.columns)):
df[i + df.shape[1]] = ""
df.columns = new_cols
df = df.replace("", pd.NA).dropna(how="all").dropna(axis=1, how="all")
print(f"✅ Detected header at row {idx}: {df.columns.tolist()}")
return df

print("⚠️ No valid header found in sheet")
return None

Meine Fragen sind:
Gibt es eine einfachere oder effizientere Möglichkeit, die Header für CSV/Excel -Dateien dynamisch umzubenennen, bei denen die Header möglicherweise nach ein paar Metadata -Zeilen erscheinen können. str.lower (). strip () oder gibt es eine robustere Methode für Bankaussagen mit unterschiedlichen Spaltennamen?>

1755808774

Anonymous

Ich habe Bankaussagen sowohl in Excel- als auch in CSV -Formaten. Die Header können je nach Bank oder Dateixport geringfügig variieren, zum Beispiel: < /p>
[code]TRAN_DATE, CHQNO, PARTICULARS, DR, CR, BAL, SOL
< /code>
Ich möchte diese Spaltennamen auf konsistente Namen wie: < /p>
normalisieren.{
"TRAN_DATE": "transaction_date",
"DR": "debit_amount",
"CR": "credit_amount",
"PARTICULARS": "narration",
"CHQNO": "cheque_no",
...
}
< /code>
Ich habe eine Funktion geschrieben, um die Header -Zeile dynamisch zu erkennen: < /p>
def detect_header(self, df_raw, min_match=2, min_cols=3, max_scan=200):
normalized_mapping = {self.normalize_header(k): v for k, v in COLUMN_MAPPING.items()}
valid_headers = set(normalized_mapping.keys())

df_raw = df_raw.fillna("")

for idx in range(min(len(df_raw), max_scan)):
row = df_raw.iloc[idx].tolist()
split_row = []
for c in row:
if isinstance(c, str) and "," in c:
split_row.extend([x.strip() for x in c.split(",") if x.strip()])
elif isinstance(c, str) and c.strip():
split_row.append(c.strip())

values = [self.normalize_header(c) for c in split_row]
matches = [v for v in values if v in valid_headers]

if len(matches) >= 4:
new_cols = [normalized_mapping.get(self.normalize_header(c), c) for c in split_row]
df = df_raw.iloc[idx+1:].reset_index(drop=True)
if len(df.columns) < len(new_cols):
for i in range(len(new_cols) - len(df.columns)):
df[i + df.shape[1]] = ""
df.columns = new_cols
df = df.replace("", pd.NA).dropna(how="all").dropna(axis=1, how="all")
print(f"✅ Detected header at row {idx}: {df.columns.tolist()}")
return df

print("⚠️ No valid header found in sheet")
return None
[/code]
Meine Fragen sind: 
Gibt es eine einfachere oder effizientere Möglichkeit, die Header für CSV/Excel -Dateien dynamisch umzubenennen, bei denen die Header möglicherweise nach ein paar Metadata -Zeilen erscheinen können. str.lower (). strip () oder gibt es eine robustere Methode für Bankaussagen mit unterschiedlichen Spaltennamen?>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Verstreute Erklärung der Klassen-/Instanzvariablennamen in Python aufgrund der Kombination der Erklärung mit Nutzung

Last post by Anonymous « 10 Jun 2025, 14:46
Posted in Python

by Anonymous » 10 Jun 2025, 14:46 » in Python

Ich bin sehr neu in Python. Bitte lassen Sie sich nicht missfallen, wenn ich etwas verpasst habe. Infolgedessen kann ein Class -CLS nicht erkennen, welche Datenstrukturen dafür erstellt wurden, damit...

0 Replies

8 Views

Last post by Anonymous
10 Jun 2025, 14:46
Python Pandas df Spalten basierend auf der Bedingung umbenennen

Last post by Guest « 07 Jan 2025, 06:23
Posted in Python

by Guest » 07 Jan 2025, 06:23 » in Python

Ich habe einen Datenrahmen, der vier Spalten enthält, die keine Beschriftung haben (sie sind also df ,df , df und df basierend auf der Position).
Ich muss die Spaltennamen anhand der Daten...

0 Replies

27 Views

Last post by Guest
07 Jan 2025, 06:23
Erstellen Sie JSON aus CSV und fügen Sie einige Header -Linien mit Pandas hinzu

Last post by Guest « 13 Feb 2025, 11:17
Posted in Python

by Guest » 13 Feb 2025, 11:17 » in Python

Ich habe diesen Beitrag gefunden, der anfangs genau das war, wonach ich gesucht habe, aber er hat mir nicht geholfen:
Hinzufügen von Header und Fußzeile zu JSON -Ausgabe von Python
Ich habe eine CSV...

0 Replies

16 Views

Last post by Guest
13 Feb 2025, 11:17
„GenericError“ beim Versuch, Geld an die Bank zu überweisen

Last post by Guest « 25 Jan 2025, 10:18
Posted in Php

by Guest » 25 Jan 2025, 10:18 » in Php

Ich habe USD als Währung verwendet. Außerdem funktioniert es gut, wenn es mit Sandbox -Konto verwendet wird : //i.static.net/dowvu.png />

Ich erhalte genetische Fehlercode und alles sieht leer aus....

0 Replies

9 Views

Last post by Guest
25 Jan 2025, 10:18
In Pandas erfahren Sie, wie Sie Bin-Bereiche in einer aus der Wertanzahl ausgegebenen Reihe beschriften oder umbenennen

Last post by Anonymous « 17 Jan 2025, 10:55
Posted in Python

by Anonymous » 17 Jan 2025, 10:55 » in Python

In einer Reihen- oder df-Spalte möchte ich die Anzahl der Werte zählen, die in vordefinierte Bins passen (einfach) und die Bin-Werte sinnvoll beschriften (Problem).
import pandas as pd

data =
df =...

0 Replies

23 Views

Last post by Anonymous
17 Jan 2025, 10:55

Return to “Python”