Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren.
df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})
df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']})
< /code>
Was ich irgendwann möchte, ist Folgendes: < /p>
final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]})
< /code>
Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p>
df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']})
df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})
df3 = pd.merge(df1, df2, "outer")
df4 = pd.merge(df3, df2_missing, "outer")
Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?
Ich habe zwei Datenrahmen wie unten. Einige der Bereiche1_Name und Area2_Name überlappen, und ich versuche, die beiden Bereichsnamen in einer langen Liste zu kombinieren. [code]df1 = pd.DataFrame({'area1_index': [0,1,2,3,4,5], 'area1_name': ['AL','AK','AZ','AR','CA','CO']})
df2 = pd.DataFrame({'area2_index': [0,1,2,3,4,5,6], 'area2_name': ['MN','AL','CT','TX','AK','AR','CA']}) < /code> Was ich irgendwann möchte, ist Folgendes: < /p> final = pd.DataFrame({'area1_index': [nan,0,nan,nan,1,2,3,4,5], 'area1_name': [nan,'AL',nan,nan,'AK','AZ','AR','CA','CO'], 'area2_index': [0,1,2,3,4,nan,5,6,nan], 'area2_name':['MN','AL','CT','TX','AK',nan,'AR','CA',nan]}) < /code> Mein erster Gedanke war es, die überlappenden Bereichsnamen zu identifizieren, dem überlappenden DataFrame und dem fehlenden Datenframe zu beitreten, wie unten: < /p> df1_df2_overlap = pd.DataFrame({'area1_index': [0,1,3,4], 'area2_index': [1,4,5,6], 'area1_name': ['AL','AK','AR','CA']}) df2_missing = pd.DataFrame({'area2_index': [0,2,3], 'area2_name': ['MN','CT','TX']})
df3 = pd.merge(df1, df2, "outer") df4 = pd.merge(df3, df2_missing, "outer") [/code] Aber dies sortiert alles nach reichen2_index . Ich habe versucht, das Argument .sort_values () mit dem by = ['seq2_index', 'seq1_index'] zu fügen, hatte aber das gleiche Ergebnis. Wie kann ich das so bestellen, wie ich es will? Oder gibt es eine bessere Möglichkeit, DF1 und df2 zu kombinieren, ohne die überlappenden/fehlenden Komponenten identifizieren zu müssen?
Ich habe zwei Datenrahmen, die genau die gleiche Datenstruktur haben. Ich muss sie vergleichen, um festzustellen, ob sie Unterschiede in den Datensätzen haben, da ein Spaltenwert unterschiedlich ist....
Wie teilt man eine Liste in eine bestimmte Anzahl von Listen auf, nimmt die Elemente der Reihe nach und verteilt sie auf die Unterlisten (also ohne Partitionierung der Liste)?
Ich sehe viele Antworten über den Weg zum Entfernen von doppelten Schlüssel nach dem Vergleich von zwei Arrays. Halten Sie eindeutiges Array).
Zum Beispiel möchte ich den Wert von Taste vergleichen...
Ich versuche, zwei Videos miteinander zu verschmelzen. Unten ist ein Beispielcode, den ich versuche, es zu funktionieren
FileStream fs = new FileStream(@ C:\Users\test\Downloads\m.mp4 ,...
Ich habe einen Datenrahmen aus einer CSV-Datei erstellt und versuche jetzt, ein Kreuz-TAB von zwei Spalten ( Personal_status und Geschlecht ) zu erstellen. Die Ausgabe sollte so aussehen,...