by Anonymous » 09 Apr 2025, 04:10
Ich habe zwei Datenrahmen, die genau die gleiche Datenstruktur haben. Ich muss sie vergleichen, um festzustellen, ob sie Unterschiede in den Datensätzen haben, da ein Spaltenwert unterschiedlich ist.
Code: Select all
df=pd.concat([df1, df2])
df = df.reset_index(drop=True)
df_gpby = df.groupby(list(df.columns))
idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]
if df.reindex(idx).empty:
print('everything is good.')
else:
print('things do not tie out')
df.reindex(idx).to_csv('diff.csv', index=False)
Obwohl diff.csv sagt mir, was alles fehlt oder anders ist, was es nicht bezeichnet, ist, welcher Datensatz zu welchem Datenframe gehörte und welche Spaltenwerte zwischen den anfänglichen Datenrahmen für einen bestimmten Datensatz unterscheiden. Gibt es eine Möglichkeit, diese Informationen irgendwie in meiner endgültigen Ausgabe zu erhalten?
Code: Select all
Name | Age| Gender
0| Naxi | 27 | Male
1| Karan| 25 | Male
2| Tanya| 27 | Female
Name | Age| Gender
0| Naxi | 27 | Male
1| Tanya| 27 | Female
2| Karan| 24 | Male
< /code>
Ausgabe [url=viewtopic.php?t=14917]Ich möchte[/url] < /p>
Name | Age| Gender | Dataframe
Karan| 24 | Male | df2
Karan| 25 | Male | df1
Ich habe zwei Datenrahmen, die genau die gleiche Datenstruktur haben. Ich muss sie vergleichen, um festzustellen, ob sie Unterschiede in den Datensätzen haben, da ein Spaltenwert unterschiedlich ist.[code]df=pd.concat([df1, df2])
df = df.reset_index(drop=True)
df_gpby = df.groupby(list(df.columns))
idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]
if df.reindex(idx).empty:
print('everything is good.')
else:
print('things do not tie out')
df.reindex(idx).to_csv('diff.csv', index=False)
[/code]
Obwohl diff.csv sagt mir, was alles fehlt oder anders ist, was es nicht bezeichnet, ist, welcher Datensatz zu welchem Datenframe gehörte und welche Spaltenwerte zwischen den anfänglichen Datenrahmen für einen bestimmten Datensatz unterscheiden. Gibt es eine Möglichkeit, diese Informationen irgendwie in meiner endgültigen Ausgabe zu erhalten?[code] Name | Age| Gender
0| Naxi | 27 | Male
1| Karan| 25 | Male
2| Tanya| 27 | Female
Name | Age| Gender
0| Naxi | 27 | Male
1| Tanya| 27 | Female
2| Karan| 24 | Male
< /code>
Ausgabe [url=viewtopic.php?t=14917]Ich möchte[/url] < /p>
Name | Age| Gender | Dataframe
Karan| 24 | Male | df2
Karan| 25 | Male | df1
[/code]