Kumulierte Summe mit group_by - Programmiererforum

Kumulierte Summe mit group_by ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Kumulierte Summe mit group_by

Report
Quote

Post by Anonymous » 07 Jan 2026, 19:24

Angenommen, ich habe den folgenden DataFrame der Anzahl der Geburten in jedem Bundesstaat in jedem Jahr:

Code: Select all

df = pl.DataFrame(
{
"state": ["CA", "CA", "CA", "TX", "TX", "TX"],
"year": [2010, 2011, 2012, 2010, 2011, 2012],
"births": [10, 20, 30, 40, 50, 60],
}
)

Angenommen, die Bevölkerung im Jahr 2009 beträgt in allen Bundesstaaten 0.
Angenommen, die Zahl der Todesfälle beträgt in allen Bundesstaaten auch für alle Jahre 0.
Ich möchte die Bevölkerung in jedem Bundesstaat für jedes Jahr berechnen, indem ich die kumulative Geburtensumme der einzelnen Bundesstaaten für jedes Jahr verwende.
Ich habe mir Folgendes ausgedacht:

Code: Select all

df.group_by("state").agg(pl.col("births").cum_sum().alias("pop")).explode(
"pop"
).with_columns(year=df["year"])

Dazu ist jedoch das erneute Hinzufügen der Jahresspalte aus dem vorherigen Datensatz erforderlich, was nicht sehr sauber ist.
Gibt es einen besseren, saubereren Weg?
Die Dokumentation für cum_sum enthält kein Beispiel mit group_by

1767810277

Anonymous

Angenommen, ich habe den folgenden DataFrame der Anzahl der Geburten in jedem Bundesstaat in jedem Jahr:
[code]df = pl.DataFrame(
{
"state": ["CA", "CA", "CA", "TX", "TX", "TX"],
"year": [2010, 2011, 2012, 2010, 2011, 2012],
"births": [10, 20, 30, 40, 50, 60],
}
)
[/code]
Angenommen, die Bevölkerung im Jahr 2009 beträgt in allen Bundesstaaten 0.
Angenommen, die Zahl der Todesfälle beträgt in allen Bundesstaaten auch für alle Jahre 0.
Ich möchte die Bevölkerung in jedem Bundesstaat für jedes Jahr berechnen, indem ich die kumulative Geburtensumme der einzelnen Bundesstaaten für jedes Jahr verwende.
Ich habe mir Folgendes ausgedacht:
[code]df.group_by("state").agg(pl.col("births").cum_sum().alias("pop")).explode(
"pop"
).with_columns(year=df["year"])
[/code]
Dazu ist jedoch das erneute Hinzufügen der Jahresspalte aus dem vorherigen Datensatz erforderlich, was nicht sehr sauber ist.
Gibt es einen besseren, saubereren Weg?
Die Dokumentation für cum_sum enthält kein Beispiel mit group_by

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Kumulierte Summe mit group_by

Last post by Anonymous « 07 Jan 2026, 19:24
Posted in Python

by Anonymous » 07 Jan 2026, 19:24 » in Python

Angenommen, ich habe den folgenden DataFrame der Anzahl der Geburten in jedem Bundesstaat in jedem Jahr:
df = pl.DataFrame(
{
state : ,
year : ,
births : ,
}
)

Angenommen, die Bevölkerung im...

0 Replies

0 Views

Last post by Anonymous
07 Jan 2026, 19:24
MongoDB Group By '$group' Problem beim Abrufen von Datensätzen in der Aggregatfunktion für das Datum, an dem wir das Dat

Last post by Anonymous « 08 Jan 2026, 09:26
Posted in Php

by Anonymous » 08 Jan 2026, 09:26 » in Php

Ich habe ein Problem mit MongoDB mit CodeIgnitor 3 hinsichtlich der Gruppierung von Datensätzen nach dem Datumswert einer Spalte, die einen Datums-/Uhrzeitwert enthält.
Wenn ich die Mongo-Abfrage...

0 Replies

0 Views

Last post by Anonymous
08 Jan 2026, 09:26
Wie findet man eine kumulative Summe von 2D -Arrays in Numba, die zeile weise summe

Last post by Anonymous « 02 Apr 2025, 12:17
Posted in Python

by Anonymous » 02 Apr 2025, 12:17 » in Python

Ich habe ein 2-D-Array und es erfordert ein Cumsum-Reihen. Aber Axis wird in Numba nicht unterstützt. Also stecke ich fest. Jede Hilfe wird geschätzt.
from numba import jit
import numpy as np...

0 Replies

45 Views

Last post by Anonymous
02 Apr 2025, 12:17
Konvertieren Sie eine SELECT-Abfrage mit INNER JOIN, LEFT JOIN, GROUP BY, ORDER BY und MAX() in den Abfrage-Builder von

Last post by Anonymous « 04 Jan 2026, 05:40
Posted in Php

by Anonymous » 04 Jan 2026, 05:40 » in Php

Ich habe Probleme beim Übersetzen dieser Datenbankabfrage
SELECT 'conversations','conversation_id',
'conversations','conversation_subject',
MAX('conversations_messages','message_date') AS...

0 Replies

2 Views

Last post by Anonymous
04 Jan 2026, 05:40
Kann ich diese Unterabfrage verwenden, um dieses SQL-Problem zu lösen, ohne GROUP BY verwenden zu müssen?

Last post by Guest « 07 Jan 2025, 11:07
Posted in MySql

by Guest » 07 Jan 2025, 11:07 » in MySql

Kann ich diese Unterabfrage verwenden, um dieses SQL-Problem zu lösen, ohne GROUP BY verwenden zu müssen?

Zeigen Sie für jeden Kontinent den Kontinent und die Anzahl der Länder an mit einer...

0 Replies

55 Views

Last post by Guest
07 Jan 2025, 11:07

Return to “Python”