Python verschmelzen zwei Datenrahmen mit überlappenden Komponenten und hält die ursprüngliche Reihenfolge von jedem

Python verschmelzen zwei Datenrahmen mit überlappenden Komponenten und hält die ursprüngliche Reihenfolge von jedem ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Python verschmelzen zwei Datenrahmen mit überlappenden Komponenten und hält die ursprüngliche Reihenfolge von jedem

Report
Quote

Post by Anonymous » 12 Feb 2025, 23:35

Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren.

Code: Select all

df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})

df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']})
< /code>
Was ich irgendwann möchte, ist Folgendes: < /p>
final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]})
< /code>
Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p>
df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']})
df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})

df3 = pd.merge(df1, df2, "outer")
df4 = pd.merge(df3, df2_missing, "outer")

Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?

1739399753

Anonymous

Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name  und Area2_Name  überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren. 
[code]df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})

df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']})
< /code>
Was ich irgendwann möchte, ist Folgendes: < /p>
final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]})
< /code>
Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p>
df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']})
df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})

df3 = pd.merge(df1, df2, "outer")
df4 = pd.merge(df3, df2_missing, "outer")
[/code]
Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values ()  mit dem by = ['seq2_index', 'seq1_index']  zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1  und df2  zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Vergleiche zwei Datenrahmen und das Fehlen des Fehlenden in jedem Datenrahmen in Python

Last post by Anonymous « 09 Apr 2025, 04:10
Posted in Python

by Anonymous » 09 Apr 2025, 04:10 » in Python

Ich habe zwei Datenrahmen, die genau die gleiche Datenstruktur haben. Ich muss sie vergleichen, um festzustellen, ob sie Unterschiede in den Datensätzen haben, da ein Spaltenwert unterschiedlich ist....

0 Replies

16 Views

Last post by Anonymous
09 Apr 2025, 04:10
Wie verteilt man eine Liste in Unterlisten und behält dabei die ursprüngliche Reihenfolge der Elemente bei?

Last post by Guest « 03 Jan 2025, 19:02
Posted in Java

by Guest » 03 Jan 2025, 19:02 » in Java

Wie teilt man eine Liste in eine bestimmte Anzahl von Listen auf, nimmt die Elemente der Reihe nach und verteilt sie auf die Unterlisten (also ohne Partitionierung der Liste)?

Ich möchte dies so...

0 Replies

62 Views

Last post by Guest
03 Jan 2025, 19:02
Wie kann ich in einem Datenrahmen in Pandas ein Kreuz-TAB von zwei Spalten in einem Datenrahmen erstellen und eine Gesam

Last post by Anonymous « 01 Mar 2025, 15:44
Posted in Python

by Anonymous » 01 Mar 2025, 15:44 » in Python

Ich habe einen Datenrahmen aus einer CSV-Datei erstellt und versuche jetzt, ein Kreuz-TAB von zwei Spalten ( Personal_status und Geschlecht ) zu erstellen. Die Ausgabe sollte so aussehen,...

0 Replies

44 Views

Last post by Anonymous
01 Mar 2025, 15:44
Filtern Sie einen Datenrahmen durch zwei Spalten in einem anderen Datenrahmen

Last post by Anonymous « 26 Aug 2025, 10:10
Posted in Python

by Anonymous » 26 Aug 2025, 10:10 » in Python

Ich brauche einige Tipps zu einem Pandas -Problem. name date column_1 column_11
Anne 2018-01-01 some info1 some info11
John 2018-01-01 some info1 some info11
Mark 2018-02-01 some info1 some info11...

0 Replies

25 Views

Last post by Anonymous
26 Aug 2025, 10:10
Wie entferne ich die Lücke zwischen zwei Ereignissen mit demselben/überlappenden Zeitfenster in timeGridView?

Last post by Guest « 16 Jan 2025, 09:59
Posted in HTML

by Guest » 16 Jan 2025, 09:59 » in HTML

Derzeit habe ich Probleme beim Versuch, die Lücke zwischen Ereignissen zu schließen, die dasselbe Zeitfenster belegen oder überlappende Zeitfenster in der TimeGridView von FullCalendar haben, wie im...

0 Replies

13 Views

Last post by Guest
16 Jan 2025, 09:59

Return to “Python”