Page 1 of 1

Der Protokollierungsbetrieb führt zu Pandas (Äquivalent von Stata/Tidylog)

Posted: 03 Apr 2025, 02:45
by Anonymous
Wenn ich eine Operation in Stata mache, beispielsweise die Entfernung von doppelten Zeilen, wird mir die Anzahl der entfernten Zeilen mitgeteilt: < /p>

Code: Select all

. sysuse auto.dta
(1978 automobile data)

. drop if mpg
[code]def my_drop_duplicates(df, *args, **kwargs):
nrow0 = df.shape[0]
df.drop_duplicates(*args, **kwargs)
nrow1 = df.shape[0]
logging.info(f"Dropped {nrow0-nrow1} duplicates")

pd.DataFrame.my_drop_duplicates = my_drop_duplicates
< /code>
Ich denke, Sie könnten auch so etwas wie < /p>
tundef my_drop_duplicates(df, *args, **kwargs):
nrow0 = df.shape[0]
df.internal_drop_duplicates(*args, **kwargs)
nrow1 = df.shape[0]
logging.info(f"Dropped {nrow0-nrow1} duplicates")

pd.DataFrame.internal_drop_duplicates = drop_duplicates
pd.DataFrame.drop_duplicates = my_drop_duplicates