Wie filtere ich sequentielle Ereignisdaten danach, ob auf den Datensatz innerhalb von X Minuten ein bestimmtes Ereignis

Wie filtere ich sequentielle Ereignisdaten danach, ob auf den Datensatz innerhalb von X Minuten ein bestimmtes Ereignis ⇐ Python

1 post • Page 1 of 1

Anonymous

Wie filtere ich sequentielle Ereignisdaten danach, ob auf den Datensatz innerhalb von X Minuten ein bestimmtes Ereignis

Report
Quote

Post by Anonymous » 27 Oct 2025, 14:41

Ich habe einige Daten mit einer Zeitstempelspalte t, einer Ereigniskategoriespalte cat und einer user_id-Spalte. cat kann n-Werte annehmen, einschließlich des Werts A.
Ich möchte Datensätze auswählen, auf die (nicht unbedingt sofort) innerhalb von 5 Minuten ein A-Ereignis folgt (für denselben Benutzer).
In SQL würde ich Folgendes tun:

Code: Select all

select
*
from self
qualify count_if(category = 'A') over (partition by user_id order by t
range between current row and interval '5 minutes' following) > 0

Wie kann man das in Polars machen? (außer dem Wechsel zur .sql-Methode).
Ganz allgemein: Hat jemand gute Hinweise auf das entsprechende mentale Modell bei der Übersetzung von einer über (Partition nach Reihenfolge nach Zeilen / Bereich zwischen und ) SQL-Syntax in Polars?
Ich habe Folgendes versucht:

Code: Select all

df.filter(
pl.col('cat').any().over('user_id').rolling(
index_column='t',
period = '5m',
offset = '0m',
closed = 'both')
)

und Variationen davon, aber es wurde die Fehlermeldung „Fensterausdruck in Aggregation nicht zulässig“ angezeigt.
Ich habe auch versucht, .rolling direkt auf dem DataFrame zu verwenden, aber dies führt zu einer Aggregation, die ich nicht möchte (ich möchte die Struktur der Tabelle beibehalten).

1761572508

Anonymous

Ich habe einige Daten mit einer Zeitstempelspalte t, einer Ereigniskategoriespalte cat und einer user_id-Spalte. cat kann n-Werte annehmen, einschließlich des Werts A.
Ich möchte Datensätze auswählen, auf die (nicht unbedingt sofort) innerhalb von 5 Minuten ein A-Ereignis folgt (für denselben Benutzer).
In SQL würde ich Folgendes tun:
[code]select
*
from self
qualify count_if(category = 'A') over (partition by user_id order by t
range between current row and interval '5 minutes' following) > 0
[/code]
Wie kann man das in Polars machen? (außer dem Wechsel zur .sql-Methode).
Ganz allgemein: Hat jemand gute Hinweise auf das entsprechende mentale Modell bei der Übersetzung von einer  über (Partition nach  Reihenfolge nach  Zeilen / Bereich zwischen  und ) SQL-Syntax in Polars?
Ich habe Folgendes versucht:
[code]df.filter(
pl.col('cat').any().over('user_id').rolling(
index_column='t',
period = '5m',
offset = '0m',
closed = 'both')
)
[/code]
und Variationen davon, aber es wurde die Fehlermeldung „Fensterausdruck in Aggregation nicht zulässig“ angezeigt.
Ich habe auch versucht, .rolling direkt auf dem DataFrame zu verwenden, aber dies führt zu einer Aggregation, die ich nicht möchte (ich möchte die Struktur der Tabelle beibehalten).

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann ich einen Datensatz Datensatz für Datensatz in einem Spring Batch Tasklet-Job beibehalten?

Last post by Anonymous « 24 Dec 2024, 04:17
Posted in Java

by Anonymous » 24 Dec 2024, 04:17 » in Java

Ich entwickle einen Spring Batch Tasklet-Job, der die folgenden Schritte ausführt:

Ruft Dateien aus einem Ordner ab.
Verarbeitet die Dateidatensätze.
Validiert jeden Datensatz.
Behält die Daten...

0 Replies

66 Views

Last post by Anonymous
24 Dec 2024, 04:17
Wie kann ich einen Datensatz Datensatz für Datensatz in einem Spring Batch Tasklet Job beibehalten?

Last post by Guest « 05 Jan 2025, 06:28
Posted in Java

by Guest » 05 Jan 2025, 06:28 » in Java

Ich entwickle einen Spring Batch Tasklet-Job, der die folgenden Schritte ausführt:

Ruft Dateien aus einem Ordner ab.
Verarbeitet die Dateidatensätze.
Validiert jeden Datensatz.
Behält die Daten...

0 Replies

64 Views

Last post by Guest
05 Jan 2025, 06:28
Fehler beim Konvertieren von Huggingface -Datensatz in den TensorFlow -Datensatz während der Verwendung von CUDA

Last post by Anonymous « 11 Jul 2025, 11:08
Posted in Python

by Anonymous » 11 Jul 2025, 11:08 » in Python

Ich versuche, Fonetuning mit einem Datensatz von Suggingface zu erledigen. Ich bekomme immer wieder InternalError....

0 Replies

31 Views

Last post by Anonymous
11 Jul 2025, 11:08
Wie filtere ich Dateisequenzen in QFileSystemModel und QListView?

Last post by Guest « 13 Jan 2025, 14:05
Posted in Python

by Guest » 13 Jan 2025, 14:05 » in Python

Ich bin neu in Sachen Modelle, Ansichten und Delegaten. Ich habe mit QFileSystemModel und QListView erfolgreich meinen eigenen Dateibrowser in Python erstellt und möchte lernen, wie ich die Anzeige...

0 Replies

27 Views

Last post by Guest
13 Jan 2025, 14:05
Wie filtere ich Daten im RDLC-Bericht?

Last post by Guest « 14 Jan 2025, 11:01
Posted in C#

by Guest » 14 Jan 2025, 11:01 » in C#

Ich bin neu bei RDLC-Berichten in Visual Studio 2010.

Ich arbeite an einer Website und habe dabei die Berichtsfunktion von VS2010 verwendet. Ich verwende ReportViewer, um Report1.rdlc anzuzeigen. Es...

0 Replies

25 Views

Last post by Guest
14 Jan 2025, 11:01

Return to “Python”