Wie kann ich einen großen Polars-Datenrahmen partitionieren und jeden einzelnen Datenrahmen parallel in einer CSV-Datei

Wie kann ich einen großen Polars-Datenrahmen partitionieren und jeden einzelnen Datenrahmen parallel in einer CSV-Datei ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie kann ich einen großen Polars-Datenrahmen partitionieren und jeden einzelnen Datenrahmen parallel in einer CSV-Datei

Report
Quote

Post by Anonymous » 29 Oct 2025, 12:17

Ich habe einen großen Polars-Datenrahmen mit vielen Gruppen. Jetzt möchte ich den Datenrahmen nach Gruppen partitionieren und alle Unterdatenrahmen speichern. Ich kann das ganz einfach wie folgt machen:

Code: Select all

for d in df.partition_by(["group1", "group2"]):
d.write_csv(f"~/{d[0, 'group1']}_{d[0, 'group2']}.csv")

Der obige Ansatz ist jedoch sequentiell und langsam, wenn die df sehr groß ist und viele Partitionen hat.
Gibt es eine native Polars-Methode, um sie zu parallelisieren (der Codeabschnitt oben)?
Wenn nicht, wie kann ich es stattdessen auf eine native Python-Methode tun?

1761736651

Anonymous

Ich habe einen großen Polars-Datenrahmen mit vielen Gruppen. Jetzt möchte ich den Datenrahmen nach Gruppen partitionieren und alle Unterdatenrahmen speichern. Ich kann das ganz einfach wie folgt machen:
[code]for d in df.partition_by(["group1", "group2"]):
d.write_csv(f"~/{d[0, 'group1']}_{d[0, 'group2']}.csv")
[/code]
Der obige Ansatz ist jedoch sequentiell und langsam, wenn die df sehr groß ist und viele Partitionen hat.
Gibt es eine native Polars-Methode, um sie zu parallelisieren (der Codeabschnitt oben)?
Wenn nicht, wie kann ich es stattdessen auf eine native Python-Methode tun?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie vermeiden Sie Daten, die in der jublen Parallel in jublib -parallel kopiert werden?

Last post by Anonymous « 14 Feb 2025, 08:00
Posted in Python

by Anonymous » 14 Feb 2025, 08:00 » in Python

Ich habe eine Funktion f (df, x) wobei df ein großer Datenrahmen ist und X eine einfache Variable ist. Die Funktion f wird nur aus df gelesen und ändert sie nicht. Ist es möglich, den Speicher von df...

0 Replies

51 Views

Last post by Anonymous
14 Feb 2025, 08:00
Holen Sie sich einen einzelnen Spaltenwert von einer einzelnen Zeile aus einer Abfrage in Codesigniter

Last post by Anonymous « 13 Apr 2025, 10:41
Posted in Php

by Anonymous » 13 Apr 2025, 10:41 » in Php

Die folgende Funktion soll den Namen des angegebenen Asset-Code aus der Datenbank lesen, aber er löst den Fehler aus: Versuch, die Eigenschaft des Nicht-Objekts zu erhalten
public function...

0 Replies

53 Views

Last post by Anonymous
13 Apr 2025, 10:41
Beim Herunterladen/Öffnen einer CSV-Datei mit Google Chrome wird die Erweiterung der CSV-Datei in .xls geändert

Last post by Anonymous « 04 Nov 2025, 07:02
Posted in HTML

by Anonymous » 04 Nov 2025, 07:02 » in HTML

Ich habe ein A-Tag in meiner HTML-Datei, das auf eine .csv-Datei verweist. Jedes Mal, wenn ich auf den Link klicke, wird dieselbe Datei mit der Erweiterung .xls heruntergeladen. Warum?

Ich habe...

0 Replies

22 Views

Last post by Anonymous
04 Nov 2025, 07:02
So partitionieren Sie eine Liste und senden gleichzeitig Anfragen

Last post by Guest « 30 Dec 2024, 17:20
Posted in Java

by Guest » 30 Dec 2024, 17:20 » in Java

Ich möchte eine Liste in Unterlisten unterteilen und parallel eine Anfrage für jede Unterliste senden.
Ich habe eine Liste mit Produkt-IDs und möchte sie in Unterlisten unterteilen mit der Größe 3....

0 Replies

55 Views

Last post by Guest
30 Dec 2024, 17:20
Verwenden Sie für jeden Thread verschiedene Zertifikate (jeden Thread. Nicht Thread -Gruppe)

Last post by Anonymous « 15 May 2025, 17:46
Posted in Java

by Anonymous » 15 May 2025, 17:46 » in Java

Wie kann ich für jeden Thread (jeden Thread, nicht die Threadgruppe) in JMeter verschiedene Zertifikate verwenden?

0 Replies

56 Views

Last post by Anonymous
15 May 2025, 17:46

Return to “Python”