Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren.
df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})
df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']})
< /code>
Was ich irgendwann möchte, ist Folgendes: < /p>
final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]})
< /code>
Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p>
df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']})
df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})
df3 = pd.merge(df1, df2, "outer")
df4 = pd.merge(df3, df2_missing, "outer")
Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?
Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren. [code]df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})
df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']}) < /code> Was ich irgendwann möchte, ist Folgendes: < /p> final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]}) < /code> Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p> df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']}) df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})
df3 = pd.merge(df1, df2, "outer") df4 = pd.merge(df3, df2_missing, "outer") [/code] Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?
Wie teilt man eine Liste in eine bestimmte Anzahl von Listen auf, nimmt die Elemente der Reihe nach und verteilt sie auf die Unterlisten (also ohne Partitionierung der Liste)?
Ich sehe viele Antworten über den Weg zum Entfernen von doppelten Schlüssel nach dem Vergleich von zwei Arrays. Halten Sie eindeutiges Array).
Zum Beispiel möchte ich den Wert von Taste vergleichen...
Ich habe einen Datenrahmen aus einer CSV-Datei erstellt und versuche jetzt, ein Kreuz-TAB von zwei Spalten ( Personal_status und Geschlecht ) zu erstellen. Die Ausgabe sollte so aussehen,...
Ich habe Pandas DataFrame, über den ich iteriere, um Werte aus zwei Spalten zu erhalten ( col_1 und col_2). Die zweite Spalte enthält Listen. Was ich tun muss, ist für jeden Wert in col_1 eine Liste...
Derzeit habe ich Probleme beim Versuch, die Lücke zwischen Ereignissen zu schließen, die dasselbe Zeitfenster belegen oder überlappende Zeitfenster in der TimeGridView von FullCalendar haben, wie im...