Wie wähle ich Zeilen nach dem Filter in Polars nach benutzerdefiniertem Index aus, ähnlich wie .loc in Pandas? - Programmiererforum

Wie wähle ich Zeilen nach dem Filter in Polars nach benutzerdefiniertem Index aus, ähnlich wie .loc in Pandas? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie wähle ich Zeilen nach dem Filter in Polars nach benutzerdefiniertem Index aus, ähnlich wie .loc in Pandas?

Report
Quote

Post by Anonymous » 30 Oct 2025, 12:16

In Pandas können die Zeilenindizes nach dem Filtern/Sortieren eines DataFrames nicht sequentiell werden (z. B. [0, 10, 4]). Wenn ich .loc[10] verwende, kann ich die Zeile, die dem ursprünglichen Index 10 entspricht, aus dem DataFrame abrufen, der jetzt die zweite Zeile im gefilterten/sortierten DataFrame ist:

Code: Select all

import polars as pl

df = pl.DataFrame({"A": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})

df_pd = df.to_pandas()
filtered_df = df_pd.loc[[0, 10, 4]]

# Retrieves the row where the original index is 4
print(filtered_df.loc[4])

Dies würde Folgendes ausgeben:

Code: Select all

A    4
Name: 4, dtype: int64

Ich versuche, dieses Verhalten in Polars zu reproduzieren. Um die ursprünglichen Zeilenindizes nach dem Filtern beizubehalten, habe ich mit .with_row_index() eine Indexspalte erstellt. Allerdings bin ich mir nicht sicher, wie ich von hier aus fortfahren soll. Ich benötige eine effiziente Lösung, die es mir ermöglicht, eine ähnliche .loc-Funktionalität zu verwenden, um nach dem Filtern oder Sortieren mehrere Zeilen anhand ihrer ursprünglichen Indizes in Polars auszuwählen.

1761823005

Anonymous

In Pandas können die Zeilenindizes nach dem Filtern/Sortieren eines DataFrames nicht sequentiell werden (z. B. [0, 10, 4]). Wenn ich .loc[10] verwende, kann ich die Zeile, die dem ursprünglichen Index 10 entspricht, aus dem DataFrame abrufen, der jetzt die zweite Zeile im gefilterten/sortierten DataFrame ist:
[code]import polars as pl

df = pl.DataFrame({"A": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})

df_pd = df.to_pandas()
filtered_df = df_pd.loc[[0, 10, 4]]

# Retrieves the row where the original index is 4
print(filtered_df.loc[4])
[/code]
Dies würde Folgendes ausgeben:
[code]A    4
Name: 4, dtype: int64
[/code]
Ich versuche, dieses Verhalten in Polars zu reproduzieren. Um die ursprünglichen Zeilenindizes nach dem Filtern beizubehalten, habe ich mit .with_row_index() eine Indexspalte erstellt. Allerdings bin ich mir nicht sicher, wie ich von hier aus fortfahren soll. Ich benötige eine effiziente Lösung, die es mir ermöglicht, eine ähnliche .loc-Funktionalität zu verwenden, um nach dem Filtern oder Sortieren mehrere Zeilen anhand ihrer ursprünglichen Indizes in Polars auszuwählen.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie wähle ich Zeilen mit mehreren Wert in Pandas aus / speichern Sie Zeilen?

Last post by Anonymous « 10 May 2025, 19:57
Posted in Python

by Anonymous » 10 May 2025, 19:57 » in Python

Ich habe Finanzdaten, in denen ich Zeilen speichern /finden muss, die einen Mehrwert haben, und eine Bedingung, wobei derselbe Wert mehr als /= 2 und nicht (Wert) gleich 0 oder
Ich möchte dies...

0 Replies

19 Views

Last post by Anonymous
10 May 2025, 19:57
Wie wähle ich von Index [3] zum Index [8] in einer Liste auf Python aus?

Last post by Anonymous « 01 Mar 2025, 15:24
Posted in Python

by Anonymous » 01 Mar 2025, 15:24 » in Python

Ich bin neu in Python und habe einige Probleme über die Übernahme von einem Spefcific -Index zu anderen. Ex: Ich fordere eine Eingabe des Namens von jedem Elternteil des Benutzers an und möchte nur...

0 Replies

62 Views

Last post by Anonymous
01 Mar 2025, 15:24
C++-Set mit benutzerdefiniertem Typ und benutzerdefiniertem Vergleich [Duplikat]

Last post by Guest « 20 Jan 2025, 17:56
Posted in C++

by Guest » 20 Jan 2025, 17:56 » in C++

Ich habe eine Klasse wie diese
class Point {
private:
int x;
int y;
public:
Point() = default;
Point(int x_arg, int y_arg):x(x_arg), y(y_arg) {};

bool operator

0 Replies

39 Views

Last post by Guest
20 Jan 2025, 17:56
Warum ist loc [] in Pandas langsamer als Iloc []?

Last post by Anonymous « 13 May 2025, 05:07
Posted in Python

by Anonymous » 13 May 2025, 05:07 » in Python

Mir ist aufgefallen, dass die Verwendung von ILOC [] bei der Auswahl von Zeilen aus einem großen Datenrahmen tendenziell schneller als loc []

0 Replies

35 Views

Last post by Anonymous
13 May 2025, 05:07
Wie wähle ich alle Zeilen aus der Tabelle mit Hibernate aus? [Duplikat]

Last post by Guest « 31 Jan 2025, 11:50
Posted in Java

by Guest » 31 Jan 2025, 11:50 » in Java

Wir können die bestimmten Zeilendaten abrufen, aber wenn wir möchten, aber wenn ich alle Zeilendaten aus der Tabelle möchte, wie können wir das tun?
Ich möchte alle Zeilendaten aus drucken Die...

0 Replies

38 Views

Last post by Guest
31 Jan 2025, 11:50

Return to “Python”