Wie füge ich für jede numerische Spalte zwei Zeilen (Gesamt/Prozentsatz) an einen Polars-Datenrahmen hinzu? - Programmiererforum

Wie füge ich für jede numerische Spalte zwei Zeilen (Gesamt/Prozentsatz) an einen Polars-Datenrahmen hinzu? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie füge ich für jede numerische Spalte zwei Zeilen (Gesamt/Prozentsatz) an einen Polars-Datenrahmen hinzu?

Report
Quote

Post by Anonymous » 29 Oct 2025, 13:22

Zum Beispiel

Code: Select all

import polars as pl

df = pl.DataFrame({
"Col Ind": ['A','B','C','D','E'],
"Col A": [1,2,3,4,5],
"Col B": [2,4,6,8,10],
"Col C": [1,3,5,7,9],
"Col D": [5,4,3,2,1] })

Ich möchte am Ende einen Datenrahmen mit einer sechsten Zeile haben, die die Summe jeder numerischen Spalte angibt, und dann einer siebten Zeile mit dem Prozentsatz der Summe dieser Summen für jede numerische Spalte
Um die beiden neuen Zeilen zu erstellen, musste ich mir die folgende sehr komplizierte Methode einfallen lassen:

Code: Select all

first_col = df.select("Col Ind").to_series().append(pl.Series("temp", ["Total", "Percentage"]))
df = df.drop("Col Ind")
cols = df.columns
expr = df.select(pl.sum(cols))
rowlist = list(expr.row(0))
full = sum(rowlist)
pc_row = []
for n in range(len(rowlist)):
pc_row.append(int(rowlist[n] /full *100))

pc_dict = dict(zip(cols, pc_row))
pc_df = pl.DataFrame(pc_dict)
df = pl.concat([df,expr])
df = pl.concat([df,pc_df])
df.insert_column(0, first_col)

Code: Select all

┌────────────┬───────┬───────┬───────┬───────┐
│ Col Ind    ┆ Col A ┆ Col B ┆ Col C ┆ Col D │
│ ---        ┆ ---   ┆ ---   ┆ ---   ┆ ---   │
│ str        ┆ i64   ┆ i64   ┆ i64   ┆ i64   │
╞════════════╪═══════╪═══════╪═══════╪═══════╡
│ A          ┆ 1     ┆ 2     ┆ 1     ┆ 5     │
│ B          ┆ 2     ┆ 4     ┆ 3     ┆ 4     │
│ C          ┆ 3     ┆ 6     ┆ 5     ┆ 3     │
│ D          ┆ 4     ┆ 8     ┆ 7     ┆ 2     │
│ E          ┆ 5     ┆ 10    ┆ 9     ┆ 1     │
│ Total      ┆ 15    ┆ 30    ┆ 25    ┆ 15    │
│ Percentage ┆ 17    ┆ 35    ┆ 29    ┆ 17    │
└────────────┴───────┴───────┴───────┴───────┘

Das funktioniert, scheint aber sehr viele Schritte zu erfordern
Gibt es einen einfacheren Weg?
Vielen Dank

1761740558

Anonymous

Zum Beispiel
[code]import polars as pl

df = pl.DataFrame({
"Col Ind": ['A','B','C','D','E'],
"Col A": [1,2,3,4,5],
"Col B": [2,4,6,8,10],
"Col C": [1,3,5,7,9],
"Col D": [5,4,3,2,1] })
[/code]
Ich möchte am Ende einen Datenrahmen mit einer sechsten Zeile haben, die die Summe jeder numerischen Spalte angibt, und dann einer siebten Zeile mit dem Prozentsatz der Summe dieser Summen für jede numerische Spalte
Um die beiden neuen Zeilen zu erstellen, musste ich mir die folgende sehr komplizierte Methode einfallen lassen:
[code]first_col = df.select("Col Ind").to_series().append(pl.Series("temp", ["Total", "Percentage"]))
df = df.drop("Col Ind")
cols = df.columns
expr = df.select(pl.sum(cols))
rowlist = list(expr.row(0))
full = sum(rowlist)
pc_row = []
for n in range(len(rowlist)):
pc_row.append(int(rowlist[n] /full *100))

pc_dict = dict(zip(cols, pc_row))
pc_df = pl.DataFrame(pc_dict)
df = pl.concat([df,expr])
df = pl.concat([df,pc_df])
df.insert_column(0, first_col)
[/code]
[code]┌────────────┬───────┬───────┬───────┬───────┐
│ Col Ind    ┆ Col A ┆ Col B ┆ Col C ┆ Col D │
│ ---        ┆ ---   ┆ ---   ┆ ---   ┆ ---   │
│ str        ┆ i64   ┆ i64   ┆ i64   ┆ i64   │
╞════════════╪═══════╪═══════╪═══════╪═══════╡
│ A          ┆ 1     ┆ 2     ┆ 1     ┆ 5     │
│ B          ┆ 2     ┆ 4     ┆ 3     ┆ 4     │
│ C          ┆ 3     ┆ 6     ┆ 5     ┆ 3     │
│ D          ┆ 4     ┆ 8     ┆ 7     ┆ 2     │
│ E          ┆ 5     ┆ 10    ┆ 9     ┆ 1     │
│ Total      ┆ 15    ┆ 30    ┆ 25    ┆ 15    │
│ Percentage ┆ 17    ┆ 35    ┆ 29    ┆ 17    │
└────────────┴───────┴───────┴───────┴───────┘
[/code]
Das funktioniert, scheint aber sehr viele Schritte zu erfordern
Gibt es einen einfacheren Weg?
Vielen Dank

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie extrahiere ich ein Substring aus einer Spalte in einem Datenrahmen, das in der Spalte aus einem anderen Datenrahmen

Last post by Anonymous « 25 Apr 2025, 09:21
Posted in Python

by Anonymous » 25 Apr 2025, 09:21 » in Python

Ich habe eine Lösung aus meinem Problem gefunden, aber es ist eindeutig die dumm und ineffizienteste. Ich hatte gehofft, dass mir jemand bei einer richtigen Lösung helfen könnte.
Ich habe zwei...

0 Replies

69 Views

Last post by Anonymous
25 Apr 2025, 09:21
Wie kann ich einen großen Polars-Datenrahmen partitionieren und jeden einzelnen Datenrahmen parallel in einer CSV-Datei

Last post by Anonymous « 29 Oct 2025, 12:17
Posted in Python

by Anonymous » 29 Oct 2025, 12:17 » in Python

Ich habe einen großen Polars-Datenrahmen mit vielen Gruppen. Jetzt möchte ich den Datenrahmen nach Gruppen partitionieren und alle Unterdatenrahmen speichern. Ich kann das ganz einfach wie folgt...

0 Replies

14 Views

Last post by Anonymous
29 Oct 2025, 12:17
Wie füge ich die Zeilen zum DataTable hinzu, während Executereader die Zeilen aus der Tabelle liest?

Last post by Guest « 08 Feb 2025, 06:27
Posted in C#

by Guest » 08 Feb 2025, 06:27 » in C#

Ich möchte die Zeilen hinzufügen, die von Executereader zum neuen DataTable mit C# Codierung gelesen werden.

0 Replies

43 Views

Last post by Guest
08 Feb 2025, 06:27
Wie füge ich eine neue Spalte nach einer anderen vorhandenen Spalte in Flask-Migrate hinzu?

Last post by Anonymous « 03 Apr 2025, 10:03
Posted in Python

by Anonymous » 03 Apr 2025, 10:03 » in Python

flask-migrate erkannte meine Spaltenänderungen und konnte die Migration erfolgreich erstellen und ausführen.def upgrade():
# ### commands auto generated by Alembic - please adjust! ###
with...

0 Replies

53 Views

Last post by Anonymous
03 Apr 2025, 10:03
Wie extrahiere ich alle doppelten Zeilen mit einer Bedingung in einem Polars -Datenrahmen richtig?

Last post by Anonymous « 21 May 2025, 15:50
Posted in Python

by Anonymous » 21 May 2025, 15:50 » in Python

Bei einem Polars -Datenframe wird ich alle doppelten Zeilen extrahieren und gleichzeitig eine zusätzliche Filterbedingung anwenden, zum Beispiel:
import polars as pl

df = pl.DataFrame({
name : ,...

0 Replies

33 Views

Last post by Anonymous
21 May 2025, 15:50

Return to “Python”