Ich habe einen Polars -Datenrahmen, bei dem jede ID mehrmals mit unterschiedlichen Zustandswerten (entweder 1 oder 2) angezeigt wird. Ich möchte zählen, wie viele eindeutige IDs nur den Zustand 1, nur den Zustand 2 oder beide Zustände 1 und 2. < /p>
haben
Ich möchte zählen, wie viele eindeutige IDs in jede Kategorie fallen:
• Nur Status 1 (z. B. IDs, die nur 1 haben)
• Beide Zustände 1 und 2 (z. B. IDs, die sowohl 1 als auch 2 haben) < /p>
Erwartete Ergebnisse (Beispiel): < /p>
Ich habe einen Polars -Datenrahmen, bei dem jede ID mehrmals mit unterschiedlichen Zustandswerten (entweder 1 oder 2) angezeigt wird. Ich möchte zählen, wie viele eindeutige IDs nur den Zustand 1, nur den Zustand 2 oder beide Zustände 1 und 2. < /p> haben[code]import polars as pl
df = pl.DataFrame({ "id": [1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 9, 9, 10, 10, 10, 11, 11, 12, 12, 13, 14, 15, 15, 16, 16, 17, 17, 18, 18, 19, 20, 20, 20], "state": [1, 2, 1, 1, 2, 2, 1, 2, 1, 1, 2, 2, 1, 1, 2, 1, 2, 1, 2, 2, 2, 2, 1, 1, 2, 2, 1, 2, 1, 2, 1, 1, 2, 2, 1, 1, 2, 2] }) [/code] Ich möchte zählen, wie viele eindeutige IDs in jede Kategorie fallen: • Nur Status 1 (z. B. IDs, die nur 1 haben) • Beide Zustände 1 und 2 (z. B. IDs, die sowohl 1 als auch 2 haben) < /p> Erwartete Ergebnisse (Beispiel): < /p> [code]State combination [1] -> 20 IDs State combination [2] -> 15 IDs State combination [1, 2] -> 30 IDs [/code]
Ich versuche, Polars DataFrame zu verwenden, in dem ich die erste und die letzte Zeile pro Gruppe auswählen möchte. Hier ist ein einfaches Beispiel für die Auswahl der ersten Zeile pro Gruppe:...
Ich habe einen LazyFrame in Python und möchte IT -Spalten von einem anderen LazyFrame hinzufügen. Die beiden LazyFrames haben die gleiche Anzahl von Zeilen und verschiedenen Spalten. > def...
Ich möchte einer Spalte einen zufälligen Float (von 0 bis 1) zuweisen, der einen eindeutigen Wert innerhalb eines Pandas -Datenfreame enthält. ; Ich möchte eine neue Spalte mit einem einzigartigen...