Vergleiche zwei Datenrahmen und das Fehlen des Fehlenden in jedem Datenrahmen in Python
Posted: 09 Apr 2025, 04:10
Ich habe zwei Datenrahmen, die genau die gleiche Datenstruktur haben. Ich muss sie vergleichen, um festzustellen, ob sie Unterschiede in den Datensätzen haben, da ein Spaltenwert unterschiedlich ist.
Obwohl diff.csv sagt mir, was alles fehlt oder anders ist, was es nicht bezeichnet, ist, welcher Datensatz zu welchem Datenframe gehörte und welche Spaltenwerte zwischen den anfänglichen Datenrahmen für einen bestimmten Datensatz unterscheiden. Gibt es eine Möglichkeit, diese Informationen irgendwie in meiner endgültigen Ausgabe zu erhalten?
Code: Select all
df=pd.concat([df1, df2])
df = df.reset_index(drop=True)
df_gpby = df.groupby(list(df.columns))
idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]
if df.reindex(idx).empty:
print('everything is good.')
else:
print('things do not tie out')
df.reindex(idx).to_csv('diff.csv', index=False)
Code: Select all
Name | Age| Gender
0| Naxi | 27 | Male
1| Karan| 25 | Male
2| Tanya| 27 | Female
Name | Age| Gender
0| Naxi | 27 | Male
1| Tanya| 27 | Female
2| Karan| 24 | Male
< /code>
Ausgabe [url=viewtopic.php?t=14917]Ich möchte[/url] < /p>
Name | Age| Gender | Dataframe
Karan| 24 | Male | df2
Karan| 25 | Male | df1