Dask „var“ und „std“ mit ddof im Groupby-Kontext und anderen Aggregationen

Dask „var“ und „std“ mit ddof im Groupby-Kontext und anderen Aggregationen ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Dask „var“ und „std“ mit ddof im Groupby-Kontext und anderen Aggregationen

Post by Anonymous » 27 Dec 2024, 14:42

Angenommen, ich möchte Varianz und/oder Standardabweichung mit nicht standardmäßigem ddof in einem Groupby-Kontext berechnen, kann ich Folgendes tun:

Code: Select all

df.groupby("a")["b"].var(ddof=2)

Wenn ich möchte, dass dies zusammen mit anderen Aggregationen geschieht, kann ich Folgendes verwenden:

Code: Select all

df.groupby("a").agg(b_var = ("b", "var"), c_sum = ("c", "sum"))

Mein Verständnis ist, dass ich eine benutzerdefinierte Aggregation erstellen sollte, um ein nicht standardmäßiges ddof haben zu können.
Hier habe ich es bekommen weit:

Code: Select all

def var(ddof: int = 1) -> dd.Aggregation:
import dask.dataframe as dd

return dd.Aggregation(
name="var",
chunk=lambda s: (s.count(), s.sum(), (s.pow(2)).sum()),
agg=lambda count, sum_, sum_sq: (count.sum(), sum_.sum(), sum_sq.sum()),
finalize=lambda count, sum_, sum_sq: (sum_sq - (sum_ ** 2 / count)) / (count - ddof),
)

Dennoch stoße ich auf einen RuntimeError:

Code: Select all

df.groupby("a").agg({"b": var(2)})

RuntimeError('Fehler beim Generieren von Metadaten für DecomposableGroupbyAggregation(frame=df, arg={'b':
Was fehlt mir? Gibt es einen besseren Weg, dies zu erreichen?
Ersetzen s.pow(2) mit s**2 führt ebenfalls zu einem Fehler.
Vollständiges Skript:

Code: Select all

import dask.dataframe as dd

data = {
"a": [1, 1, 1, 1, 2, 2, 2],
"b": range(7),
"c": range(10, 3, -1),
}

df = dd.from_dict(data, 2)

def var(ddof: int = 1) -> dd.Aggregation:
import dask.dataframe as dd

return dd.Aggregation(
name="var",
chunk=lambda s: (s.count(), s.sum(), (s.pow(2)).sum()),
agg=lambda count, sum_, sum_sq: (count.sum(), sum_.sum(), sum_sq.sum()),
finalize=lambda count, sum_, sum_sq: (sum_sq - (sum_ ** 2 / count)) / (count - ddof),
)

df.groupby("a").agg(b_var = ("b", "var"), c_sum = ("c", "sum"))  #

1735306959

Anonymous

Angenommen, ich möchte Varianz und/oder Standardabweichung mit nicht standardmäßigem ddof in einem Groupby-Kontext berechnen, kann ich Folgendes tun:
[code]df.groupby("a")["b"].var(ddof=2)
[/code]
Wenn ich möchte, dass dies zusammen mit anderen Aggregationen geschieht, kann ich Folgendes verwenden:
[code]df.groupby("a").agg(b_var = ("b", "var"), c_sum = ("c", "sum"))
[/code]
Mein Verständnis ist, dass ich eine benutzerdefinierte Aggregation erstellen sollte, um ein nicht standardmäßiges ddof haben zu können.
Hier habe ich es bekommen weit:
[code]def var(ddof: int = 1) -> dd.Aggregation:
import dask.dataframe as dd

return dd.Aggregation(
name="var",
chunk=lambda s: (s.count(), s.sum(), (s.pow(2)).sum()),
agg=lambda count, sum_, sum_sq: (count.sum(), sum_.sum(), sum_sq.sum()),
finalize=lambda count, sum_, sum_sq: (sum_sq - (sum_ ** 2 / count)) / (count - ddof),
)
[/code]
Dennoch stoße ich auf einen RuntimeError:
[code]df.groupby("a").agg({"b": var(2)})
[/code]
RuntimeError('Fehler beim Generieren von Metadaten für DecomposableGroupbyAggregation(frame=df, arg={'b': 
Was fehlt mir? Gibt es einen besseren Weg, dies zu erreichen?
Ersetzen s.pow(2) mit s**2 führt ebenfalls zu einem Fehler.
Vollständiges Skript:
[code]import dask.dataframe as dd

data = {
"a": [1, 1, 1, 1, 2, 2, 2],
"b": range(7),
"c": range(10, 3, -1),
}

df = dd.from_dict(data, 2)

def var(ddof: int = 1) -> dd.Aggregation:
import dask.dataframe as dd

return dd.Aggregation(
name="var",
chunk=lambda s: (s.count(), s.sum(), (s.pow(2)).sum()),
agg=lambda count, sum_, sum_sq: (count.sum(), sum_.sum(), sum_sq.sum()),
finalize=lambda count, sum_, sum_sq: (sum_sq - (sum_ ** 2 / count)) / (count - ddof),
)

df.groupby("a").agg(b_var = ("b", "var"), c_sum = ("c", "sum"))  #

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Dask „var“ und „std“ mit ddof im Groupby-Kontext und anderen Aggregationen

Last post by Anonymous « 29 Dec 2024, 10:58
Posted in Python

by Anonymous » 29 Dec 2024, 10:58 » in Python

Angenommen, ich möchte Varianz und/oder Standardabweichung mit nicht standardmäßigem ddof in einem Groupby-Kontext berechnen, kann ich Folgendes tun:
df.groupby( a ) .var(ddof=2)

Wenn ich möchte,...

0 Replies

3 Views

Last post by Anonymous
29 Dec 2024, 10:58
STD: Bewegen Sie eine std :: string von einem std :: deque, dann std :: deque :: pop_front?

Last post by Guest « 07 Feb 2025, 00:25
Posted in C++

by Guest » 07 Feb 2025, 00:25 » in C++

Während ich normalerweise meine eigenen Klassen verwende, die vor stl erstellt wurden. Ich habe beschlossen, diese STL -Objekte und Funktionen in einer eigenständigen Bibliothek zu verwenden, die...

0 Replies

44 Views

Last post by Guest
07 Feb 2025, 00:25
Wird das Hinzufügen von STD :: String -Elementen zu std :: deque mit std :: move effizienter sein?

Last post by Guest « 07 Feb 2025, 01:19
Posted in C++

by Guest » 07 Feb 2025, 01:19 » in C++

in diesem Code:
// build string requiring a bunch of processing
std::wstring xmlstr=xml->GetXml();

{
std::lock_guard guard(my_mutex);
m_deque.push_back(std::move(xmlstr)); //

0 Replies

32 Views

Last post by Guest
07 Feb 2025, 01:19
Maskierte Aggregationen in Pytorch

Last post by Anonymous « 02 Mar 2025, 12:55
Posted in Python

by Anonymous » 02 Mar 2025, 12:55 » in Python

Gegebene Daten und Masken-Tensoren Gibt es einen Pytorch-Weg, um maskierte Datenaggregationen (Mittelwert, max, min usw.) zu erhalten.
x = torch.tensor([
,

])

mask = torch.tensor([
,

])

Um...

0 Replies

3 Views

Last post by Anonymous
02 Mar 2025, 12:55
Kann ein Konzept gegen std::variant und std::vector geprüft werden?

Last post by Guest « 11 Jan 2025, 11:14
Posted in C++

by Guest » 11 Jan 2025, 11:14 » in C++

Hier gibt es einfache (vielleicht naive) Konzepte. Sie sollen Typen abschneiden, die mit einem bestimmten Operator nicht kompatibel sind.
namespace concepts
{
template
concept...

0 Replies

30 Views

Last post by Guest
11 Jan 2025, 11:14

Return to “Python”