Ich habe also df.with_columns (pl.col ('Jahr') ausprobiert. Over ('id'). alias ('einzigartig_years')) , aber dies gibt das falsche Ergebnis. Also habe ich < /p>
ausgedacht
df.join(df.group_by('ID').agg(pl.col('YEAR').unique().len().alias('UNIQUE_YEARS')), on='ID', how='left')
< /code>
Was gibt ein korrektes Ergebnis! Aber es sieht ein bisschen klobig aus und ich frage mich, ob es einen natürlicheren Weg mit _columns
Ich versuche, ein CPP -Programm zu schreiben, das als sudo für ein gesichtsloses Konto fungiert. Grundsätzlich möchte ich, dass der Befehl eher als gesichtsloses Konto ausgeführt wird als als der...
Ich versuche, ein CPP -Programm zu schreiben, das als sudo für ein gesichtsloses Konto fungiert. Grundsätzlich möchte ich, dass der Befehl eher als gesichtsloses Konto ausgeführt wird als als der...
Ich habe nach beobachtbar gemacht, dass nur Änderungen für bestimmte Ressourcen-ID-Filter filtern:
var valueChangesObs = events
.GroupBy(e => e.ResourceId)
.SelectMany(e => e.DistinctUntilChanged(e...
Wenn ich eine Liste von Dateien habe, l = mit den Größen S1, S2, ..., Sn und ich erstelle einen df mit df = pl.scan_csv (l, ...) oder df = pl.Scan_Parquet (l, l. d.h. ?