Vergleiche zwei Datenrahmen und das Fehlen des Fehlenden in jedem Datenrahmen in PythonPython

Python-Programme
Anonymous
 Vergleiche zwei Datenrahmen und das Fehlen des Fehlenden in jedem Datenrahmen in Python

Post by Anonymous »

Ich habe zwei Datenrahmen, die genau die gleiche Datenstruktur haben. Ich muss sie vergleichen, um festzustellen, ob sie Unterschiede in den Datensätzen haben, da ein Spaltenwert unterschiedlich ist.

Code: Select all

df=pd.concat([df1, df2])
df = df.reset_index(drop=True)
df_gpby = df.groupby(list(df.columns))
idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]
if df.reindex(idx).empty:
print('everything is good.')
else:
print('things do not tie out')
df.reindex(idx).to_csv('diff.csv', index=False)

Obwohl diff.csv sagt mir, was alles fehlt oder anders ist, was es nicht bezeichnet, ist, welcher Datensatz zu welchem ​​Datenframe gehörte und welche Spaltenwerte zwischen den anfänglichen Datenrahmen für einen bestimmten Datensatz unterscheiden. Gibt es eine Möglichkeit, diese Informationen irgendwie in meiner endgültigen Ausgabe zu erhalten?

Code: Select all

   Name | Age| Gender
0| Naxi | 27 | Male
1| Karan| 25 | Male
2| Tanya| 27 | Female

Name | Age| Gender
0| Naxi | 27 | Male
1| Tanya| 27 | Female
2| Karan| 24 | Male
< /code>
Ausgabe [url=viewtopic.php?t=14917]Ich möchte[/url] < /p>
   Name | Age| Gender | Dataframe
Karan| 24 | Male   | df2
Karan| 25 | Male   | df1

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post