Fügen Sie eine Spalte zu einem Polars DataFrame hinzu, basierend auf einer gruppierten Aggregation einer anderen Spalte

Fügen Sie eine Spalte zu einem Polars DataFrame hinzu, basierend auf einer gruppierten Aggregation einer anderen Spalte ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Fügen Sie eine Spalte zu einem Polars DataFrame hinzu, basierend auf einer gruppierten Aggregation einer anderen Spalte

Report
Quote

Post by Anonymous » 16 Jan 2026, 02:12

Ich habe einen LazyFrame aus Zeit, Symbolen und mittlerem_Preis:
Beispiel:

Code: Select all

time                symbols             mid_price
datetime[ns]        str                 f64
2024-03-01 00:01:00 "PERP_SOL_USDT@…    126.1575
2024-03-01 00:01:00 "PERP_WAVES_USD…    2.71235
2024-03-01 00:01:00 "SOL_USDT@BINAN…    126.005
2024-03-01 00:01:00 "WAVES_USDT@BIN…    2.7085
2024-03-01 00:02:00 "PERP_SOL_USDT@…    126.3825

Ich möchte einige Aggregationen über die Zeitdimension durchführen (z. B. nach Symbol gruppieren):

Code: Select all

aggs = (
df
.group_by('symbols')
.agg([
pl.col('mid_price').diff(1).alias("change"),
])
)

Ich erhalte eine Liste jedes Werts pro eindeutigem Symbol zurück Wert:

Code: Select all

>>> aggs.head().collect()

symbols             change
str                 list[f64]
"SOL_USDT@BINAN…    [null, 0.25, … -0.55]
"PERP_SOL_USDT@…    [null, 0.225, … -0.605]
"WAVES_USDT@BIN…    [null, -0.002, … -0.001]
"PERP_WAVES_USD…    [null, -0.00255, … 0.0001]

Ich möchte dies jetzt wieder mit meinem ursprünglichen Datenrahmen verbinden:

Code: Select all

df = df.join(
aggs,
on='symbols',
how='left',
)

Dies führt nun dazu, dass jede Zeile die vollständige Liste der Änderungen erhält und nicht den jeweiligen Wert.

Code: Select all

>>> df.head().collect()

time                symbols             mid_price   change
datetime[ns]        str                 f64         list[f64]
2024-03-01 00:01:00 "PERP_SOL_USDT@…    126.1575    [null, 0.225, … -0.605]
2024-03-01 00:01:00 "PERP_WAVES_USD…    2.71235     [null, -0.00255, … 0.0001]
2024-03-01 00:01:00 "SOL_USDT@BINAN…    126.005     [null, 0.25, … -0.55]
2024-03-01 00:01:00 "WAVES_USDT@BIN…    2.7085      [null, -0.002, … -0.001]
2024-03-01 00:02:00 "PERP_SOL_USDT@…    126.3825    [null, 0.225, … -0.605]

Ich habe bitte zwei Fragen:

Wie kann ich die von meinem „group_by“ zurückgegebenen Listen entstapeln/auflösen, wenn ich sie wieder mit dem ursprünglichen Datenrahmen zusammenfüge?
Ist dies die empfohlene Methode, um aus einem „group_by“ eine neue Spalte zu meinem ursprünglichen Datenrahmen hinzuzufügen (das heißt: „group_by“ gefolgt von beitreten)?

1768525950

Anonymous

Ich habe einen LazyFrame aus Zeit, Symbolen und mittlerem_Preis:
Beispiel:
[code]time                symbols             mid_price
datetime[ns]        str                 f64
2024-03-01 00:01:00 "PERP_SOL_USDT@…    126.1575
2024-03-01 00:01:00 "PERP_WAVES_USD…    2.71235
2024-03-01 00:01:00 "SOL_USDT@BINAN…    126.005
2024-03-01 00:01:00 "WAVES_USDT@BIN…    2.7085
2024-03-01 00:02:00 "PERP_SOL_USDT@…    126.3825
[/code]
Ich möchte einige Aggregationen über die Zeitdimension durchführen (z. B. nach Symbol gruppieren):
[code]aggs = (
df
.group_by('symbols')
.agg([
pl.col('mid_price').diff(1).alias("change"),
])
)
[/code]
Ich erhalte eine Liste jedes Werts pro eindeutigem Symbol zurück Wert:
[code]>>> aggs.head().collect()

symbols             change
str                 list[f64]
"SOL_USDT@BINAN…    [null, 0.25, … -0.55]
"PERP_SOL_USDT@…    [null, 0.225, … -0.605]
"WAVES_USDT@BIN…    [null, -0.002, … -0.001]
"PERP_WAVES_USD…    [null, -0.00255, … 0.0001]
[/code]
Ich möchte dies jetzt wieder mit meinem ursprünglichen Datenrahmen verbinden:
[code]df = df.join(
aggs,
on='symbols',
how='left',
)
[/code]
Dies führt nun dazu, dass jede Zeile die vollständige Liste der Änderungen erhält und nicht den jeweiligen Wert.
[code]>>> df.head().collect()

time                symbols             mid_price   change
datetime[ns]        str                 f64         list[f64]
2024-03-01 00:01:00 "PERP_SOL_USDT@…    126.1575    [null, 0.225, … -0.605]
2024-03-01 00:01:00 "PERP_WAVES_USD…    2.71235     [null, -0.00255, … 0.0001]
2024-03-01 00:01:00 "SOL_USDT@BINAN…    126.005     [null, 0.25, … -0.55]
2024-03-01 00:01:00 "WAVES_USDT@BIN…    2.7085      [null, -0.002, … -0.001]
2024-03-01 00:02:00 "PERP_SOL_USDT@…    126.3825    [null, 0.225, … -0.605]
[/code]
Ich habe bitte zwei Fragen:
[list]
[*]Wie kann ich die von meinem „group_by“ zurückgegebenen Listen entstapeln/auflösen, wenn ich sie wieder mit dem ursprünglichen Datenrahmen zusammenfüge?
[*]Ist dies die empfohlene Methode, um aus einem „group_by“ eine neue Spalte zu meinem ursprünglichen Datenrahmen hinzuzufügen (das heißt: „group_by“ gefolgt von beitreten)?
[/list]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Pandas Fügen Sie die Spalte mit einem Wert hinzu, der auf der Bedingung basierend auf anderen Spalten basiert

Last post by Anonymous « 18 Apr 2025, 00:39
Posted in Python

by Anonymous » 18 Apr 2025, 00:39 » in Python

Ich habe den folgenden PANDAS-Datenframe:

import pandas as pd
import numpy as np

d = {'age' : ,
'salary' : }

df = pd.DataFrame(d)

Und möchte eine zusätzliche Spalte namens is_rich hinzufügen,...

0 Replies

65 Views

Last post by Anonymous
18 Apr 2025, 00:39
Wie mache ich eine bestimmte Aggregation in einer Tabelle basierend auf Zeilenspaltenwerten in einer anderen Tabelle (SQ

Last post by Anonymous « 11 May 2025, 23:55
Posted in Python

by Anonymous » 11 May 2025, 23:55 » in Python

Ich habe zwei Fakt -Tabellen CDI und Population und ein paar Dimensionstabellen in Duckdb geladen. Ich habe mich an der CDI Faktentabelle und ihren jeweiligen Dimensionstabellen zusammengestellt, die...

0 Replies

60 Views

Last post by Anonymous
11 May 2025, 23:55
Pandas DataFrame: Fügen Sie Spalten basierend auf der Liste der Beispiele und Spaltenüberschriften hinzu

Last post by Anonymous « 12 Mar 2025, 14:08
Posted in Python

by Anonymous » 12 Mar 2025, 14:08 » in Python

Ich möchte Spalten in meinem DF mit Werten hinzufügen, die auf der Beispielliste in einer Spalte basieren, und die nächsten Spaltenkopfzeile als Beispielnummern. Im Detail: Basierend auf der Spalte...

0 Replies

51 Views

Last post by Anonymous
12 Mar 2025, 14:08
Fügen Sie den Text ersetzen Sie den Text basierend auf einem Namen in einem anderen Skript für Datei -Python -Skript

Last post by Anonymous « 04 Mar 2025, 14:35
Posted in Python

by Anonymous » 04 Mar 2025, 14:35 » in Python

Ich habe zwei Textdateien, Datei 1 ist eine Liste von Namen von Maschen mit einem Pfad. Manchmal ist der Name der gleiche Pfadname und kann Zahlen enthalten. Die Zeilen haben immer staticMesh =...

0 Replies

52 Views

Last post by Anonymous
04 Mar 2025, 14:35
Python Polars: Wie füge ich Spalten in einem LazyFrame zu einem anderen LazyFrame hinzu?

Last post by Guest « 05 Feb 2025, 13:18
Posted in Python

by Guest » 05 Feb 2025, 13:18 » in Python

Ich habe einen LazyFrame in Python und möchte IT -Spalten von einem anderen LazyFrame hinzufügen. Die beiden LazyFrames haben die gleiche Anzahl von Zeilen und verschiedenen Spalten. > def...

0 Replies

45 Views

Last post by Guest
05 Feb 2025, 13:18

Return to “Python”