Bei einem Polardatenrahmen möchte ich alle duplizierten Zeilen extrahieren und gleichzeitig eine zusätzliche Filterbedingung anwenden, zum Beispiel:
import polars as pl
Ich habe eine Lösung aus meinem Problem gefunden, aber es ist eindeutig die dumm und ineffizienteste. Ich hatte gehofft, dass mir jemand bei einer richtigen Lösung helfen könnte.
Ich habe zwei...
Ich habe einen großen Polars-Datenrahmen mit vielen Gruppen. Jetzt möchte ich den Datenrahmen nach Gruppen partitionieren und alle Unterdatenrahmen speichern. Ich kann das ganz einfach wie folgt...
Von einem Datenrahmen möchte ich nur die Duplikate mit 3 verschiedenen Zahlen in jeder Zeile zurückgeben:
df = pd.DataFrame([ , # 4,6,21 this has 3 duplicate
,
,
, # 4,12,25
,
], # 2,4,10...