Wählen Sie die erste und letzte Zeile pro Gruppe in Polars DataFrame aus
Posted: 11 Feb 2025, 14:57
Ich versuche, Polars DataFrame zu verwenden, in dem ich die erste und die letzte Zeile pro Gruppe auswählen möchte. Hier ist ein einfaches Beispiel für die Auswahl der ersten Zeile pro Gruppe: < /p>
Dies funktioniert gut und wir können. Last , um es für die letzte Zeile zu tun. Aber wie können wir diese in einer Gruppe kombinieren. ?
Code: Select all
import polars as pl
df = pl.DataFrame(
{
"a": [1, 2, 2, 3, 4, 5],
"b": [0.5, 0.5, 4, 10, 14, 13],
"c": [True, True, True, False, False, True],
"d": ["Apple", "Apple", "Apple", "Banana", "Banana", "Banana"],
}
)
result = df.group_by("d", maintain_order=True).first()
print(result)
< /code>
Ausgabe: < /p>
shape: (2, 4)
┌────────┬─────┬──────┬───────┐
│ d ┆ a ┆ b ┆ c │
│ --- ┆ --- ┆ --- ┆ --- │
│ str ┆ i64 ┆ f64 ┆ bool │
╞════════╪═════╪══════╪═══════╡
│ Apple ┆ 1 ┆ 0.5 ┆ true │
│ Banana ┆ 3 ┆ 10.0 ┆ false │
└────────┴─────┴──────┴───────┘