Python verschmelzen zwei Datenrahmen mit überlappenden Komponenten und hält die ursprüngliche Reihenfolge von jedem

Python verschmelzen zwei Datenrahmen mit überlappenden Komponenten und hält die ursprüngliche Reihenfolge von jedem ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Python verschmelzen zwei Datenrahmen mit überlappenden Komponenten und hält die ursprüngliche Reihenfolge von jedem

Report
Quote

Post by Anonymous » 12 Feb 2025, 23:35

Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren.

Code: Select all

df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})

df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']})
< /code>
Was ich irgendwann möchte, ist Folgendes: < /p>
final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]})
< /code>
Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p>
df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']})
df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})

df3 = pd.merge(df1, df2, "outer")
df4 = pd.merge(df3, df2_missing, "outer")

Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?

1739399753

Anonymous

Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name  und Area2_Name  überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren. 
[code]df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})

df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']})
< /code>
Was ich irgendwann möchte, ist Folgendes: < /p>
final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]})
< /code>
Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p>
df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']})
df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})

df3 = pd.merge(df1, df2, "outer")
df4 = pd.merge(df3, df2_missing, "outer")
[/code]
Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values ()  mit dem by = ['seq2_index', 'seq1_index']  zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1  und df2  zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie verteilt man eine Liste in Unterlisten und behält dabei die ursprüngliche Reihenfolge der Elemente bei?

Last post by Guest « 03 Jan 2025, 19:02
Posted in Java

by Guest » 03 Jan 2025, 19:02 » in Java

Wie teilt man eine Liste in eine bestimmte Anzahl von Listen auf, nimmt die Elemente der Reihe nach und verteilt sie auf die Unterlisten (also ohne Partitionierung der Liste)?

Ich möchte dies so...

0 Replies

13 Views

Last post by Guest
03 Jan 2025, 19:02
Entfernen Sie ganze Zeilen, die in zwei 2D -Arrays gefunden werden und dann [Duplikat] verschmelzen und]

Last post by Guest « 10 Feb 2025, 03:37
Posted in Php

by Guest » 10 Feb 2025, 03:37 » in Php

Ich sehe viele Antworten über den Weg zum Entfernen von doppelten Schlüssel nach dem Vergleich von zwei Arrays. Halten Sie eindeutiges Array).
Zum Beispiel möchte ich den Wert von Taste vergleichen...

0 Replies

4 Views

Last post by Guest
10 Feb 2025, 03:37
Wie kann ich in einem Datenrahmen in Pandas ein Kreuz-TAB von zwei Spalten in einem Datenrahmen erstellen und eine Gesam

Last post by Anonymous « 01 Mar 2025, 15:44
Posted in Python

by Anonymous » 01 Mar 2025, 15:44 » in Python

Ich habe einen Datenrahmen aus einer CSV-Datei erstellt und versuche jetzt, ein Kreuz-TAB von zwei Spalten ( Personal_status und Geschlecht ) zu erstellen. Die Ausgabe sollte so aussehen,...

0 Replies

0 Views

Last post by Anonymous
01 Mar 2025, 15:44
Durch das Ändern einer Teilmenge des Pandas-Datenrahmens wird auch der ursprüngliche Datenrahmen geändert

Last post by Guest « 27 Dec 2024, 10:43
Posted in Python

by Guest » 27 Dec 2024, 10:43 » in Python

Ich habe Pandas DataFrame, über den ich iteriere, um Werte aus zwei Spalten zu erhalten ( col_1 und col_2). Die zweite Spalte enthält Listen. Was ich tun muss, ist für jeden Wert in col_1 eine Liste...

0 Replies

9 Views

Last post by Guest
27 Dec 2024, 10:43
Wie entferne ich die Lücke zwischen zwei Ereignissen mit demselben/überlappenden Zeitfenster in timeGridView?

Last post by Guest « 16 Jan 2025, 09:59
Posted in HTML

by Guest » 16 Jan 2025, 09:59 » in HTML

Derzeit habe ich Probleme beim Versuch, die Lücke zwischen Ereignissen zu schließen, die dasselbe Zeitfenster belegen oder überlappende Zeitfenster in der TimeGridView von FullCalendar haben, wie im...

0 Replies

1 Views

Last post by Guest
16 Jan 2025, 09:59

Return to “Python”