Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren.
df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})
df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']})
< /code>
Was ich irgendwann möchte, ist Folgendes: < /p>
final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]})
< /code>
Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p>
df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']})
df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})
df3 = pd.merge(df1, df2, "outer")
df4 = pd.merge(df3, df2_missing, "outer")
Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?
Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren. [code]df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})
df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']}) < /code> Was ich irgendwann möchte, ist Folgendes: < /p> final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]}) < /code> Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p> df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']}) df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})
df3 = pd.merge(df1, df2, "outer") df4 = pd.merge(df3, df2_missing, "outer") [/code] Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?
Ich habe zwei Datenrahmen, die genau die gleiche Datenstruktur haben. Ich muss sie vergleichen, um festzustellen, ob sie Unterschiede in den Datensätzen haben, da ein Spaltenwert unterschiedlich ist....
Wie teilt man eine Liste in eine bestimmte Anzahl von Listen auf, nimmt die Elemente der Reihe nach und verteilt sie auf die Unterlisten (also ohne Partitionierung der Liste)?
Ich habe einen Datenrahmen aus einer CSV-Datei erstellt und versuche jetzt, ein Kreuz-TAB von zwei Spalten ( Personal_status und Geschlecht ) zu erstellen. Die Ausgabe sollte so aussehen,...
Ich brauche einige Tipps zu einem Pandas -Problem. name date column_1 column_11
Anne 2018-01-01 some info1 some info11
John 2018-01-01 some info1 some info11
Mark 2018-02-01 some info1 some info11...
Ich habe Pandas DataFrame, über den ich iteriere, um Werte aus zwei Spalten zu erhalten ( col_1 und col_2). Die zweite Spalte enthält Listen. Was ich tun muss, ist für jeden Wert in col_1 eine Liste...