Berechnen Sie effizient die Zeit bis zum ersten "Kauf" -Ereignis pro Benutzer in Pandas DataFrame

Berechnen Sie effizient die Zeit bis zum ersten "Kauf" -Ereignis pro Benutzer in Pandas DataFrame ⇐ Python

1 post • Page 1 of 1

Anonymous

Berechnen Sie effizient die Zeit bis zum ersten "Kauf" -Ereignis pro Benutzer in Pandas DataFrame

Post by Anonymous » 29 Apr 2025, 14:16

Wie kann ich die Zeit für das erste Zielereignis pro Benutzer berechnen, das Pandas effizient (mit Edge -Fällen) verwendet. Jede Zeile enthält einen user_id, event_type und timestamp. Ich möchte die Zeit (in Sekunden) aus dem ersten Ereignis jedes Benutzers zu seinem ersten Auftreten eines Zielereignisses (z. B. "Kauf") berechnen. datetime.import pandas as pd

data = [
{'user_id': 'u1', 'event_type': 'login', 'timestamp': '2023-01-01 10:00:00'},
{'user_id': 'u1', 'event_type': 'purchase', 'timestamp': '2023-01-01 10:05:00'},
{'user_id': 'u2', 'event_type': 'login', 'timestamp': '2023-01-01 09:00:00'},
{'user_id': 'u2', 'event_type': 'scroll', 'timestamp': '2023-01-01 09:03:00'},
{'user_id': 'u3', 'event_type': 'login', 'timestamp': '2023-01-01 11:00:00'},
{'user_id': 'u3', 'event_type': 'purchase', 'timestamp': '2023-01-01 11:20:00'},
]

df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])

< /code>
Was ist die sauberste und effizienteste Möglichkeit, die Zeit für das erste "Kauf" Ereignis pro Benutzer zu berechnen? /> Dann habe ich versucht, beide Ergebnisse zu verschmelzen, um den Zeitunterschied wie folgt zu berechnen: < /p>
first_event = df.groupby('user_id')['timestamp'].min()
first_purchase = df[df['event_type'] == 'purchase'].groupby('user_id')['timestamp'].min()
result = (first_purchase - first_event).dt.total_seconds()

< /code>
Was ich erwartet hatte:
Ich habe erwartet, dass dies mir eine saubere Serie oder einen Datenfreame mit user_id und die Anzahl der Sekunden zwischen dem ersten Ereignis des Benutzers und ihrem ersten "Kauf" geben würde. Nan).
Ich bin mir nicht sicher, ob dies der effizienteste oder sauberste Ansatz ist.>

1745929004

Anonymous

Wie kann ich die Zeit für das erste Zielereignis pro Benutzer berechnen, das Pandas effizient (mit Edge -Fällen) verwendet. Jede Zeile enthält einen user_id, event_type und timestamp. [url=viewtopic.php?t=14917]Ich möchte[/url] die Zeit (in Sekunden) aus dem ersten Ereignis jedes Benutzers zu seinem ersten Auftreten eines Zielereignisses (z. B. "Kauf") berechnen. datetime.import pandas as pd

data = [
{'user_id': 'u1', 'event_type': 'login', 'timestamp': '2023-01-01 10:00:00'},
{'user_id': 'u1', 'event_type': 'purchase', 'timestamp': '2023-01-01 10:05:00'},
{'user_id': 'u2', 'event_type': 'login', 'timestamp': '2023-01-01 09:00:00'},
{'user_id': 'u2', 'event_type': 'scroll', 'timestamp': '2023-01-01 09:03:00'},
{'user_id': 'u3', 'event_type': 'login', 'timestamp': '2023-01-01 11:00:00'},
{'user_id': 'u3', 'event_type': 'purchase', 'timestamp': '2023-01-01 11:20:00'},
]

df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])

< /code>
Was ist die sauberste und effizienteste Möglichkeit, die Zeit für das erste "Kauf" Ereignis pro Benutzer zu berechnen? />  Dann habe ich versucht, beide Ergebnisse zu verschmelzen, um den Zeitunterschied wie folgt zu berechnen: < /p>
first_event = df.groupby('user_id')['timestamp'].min()
first_purchase = df[df['event_type'] == 'purchase'].groupby('user_id')['timestamp'].min()
result = (first_purchase - first_event).dt.total_seconds()

< /code>
Was ich erwartet hatte:
Ich habe erwartet, dass dies mir eine saubere Serie oder einen Datenfreame mit user_id und die Anzahl der Sekunden zwischen dem ersten Ereignis des Benutzers und ihrem ersten "Kauf" geben würde. Nan). 
Ich bin mir nicht sicher, ob dies der effizienteste oder sauberste Ansatz ist.>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Pandas DataFrame, wie Sie eine neue Zeile effizient hinzufügen

Last post by Anonymous « 21 Mar 2025, 09:23
Posted in Python

by Anonymous » 21 Mar 2025, 09:23 » in Python

Ich möchte wissen, wie man dem DataFrame effizient eine neue Zeile hinzufügt. A B

columns =

user_list = pd.DataFrame(columns=columns)

Ich möchte dem DataFrame eine Zeile wie {a = 3, b = 4}...

0 Replies

4 Views

Last post by Anonymous
21 Mar 2025, 09:23
Ersetzen Sie die Werte in Pandas DataFrame anhand eines anderen DataFrame als Nachschlagetabelle

Last post by Anonymous « 30 Apr 2025, 21:24
Posted in Python

by Anonymous » 30 Apr 2025, 21:24 » in Python

Ich möchte Werte in einem Datenrahmen durch die Werte in einem zweiten Datenrahmen ersetzen, indem ich die Werte im ersten Datenrahmen mit den Spalten aus dem zweiten Datenrahmen übereinstimmt....

0 Replies

1 Views

Last post by Anonymous
30 Apr 2025, 21:24
Wie konvertiere ich die UNIX-Zeit in Datetime, wenn ich Pandas.DataFrame.from_dict verwende?

Last post by Guest « 06 Jan 2025, 22:48
Posted in Python

by Guest » 06 Jan 2025, 22:48 » in Python

Ich lese aus einer JSON-Datendatei und lade sie in ein Wörterbuch. Es als Schlüssel:Wert wie unten.
1707195600000 :1, 1707282000000 :18, 1707368400000 :1, 1707454800000 :13, 1707714000000 :18,...

0 Replies

15 Views

Last post by Guest
06 Jan 2025, 22:48
Wie konvertiere ich die UNIX-Zeit in Datetime, wenn ich Pandas.DataFrame.from_dict verwende?

Last post by Guest « 07 Jan 2025, 04:17
Posted in Python

by Guest » 07 Jan 2025, 04:17 » in Python

Ich lese aus einer JSON-Datendatei und lade sie in ein Wörterbuch. Es als Schlüssel:Wert wie unten.
1707195600000 :1, 1707282000000 :18, 1707368400000 :1, 1707454800000 :13, 1707714000000 :18,...

0 Replies

10 Views

Last post by Guest
07 Jan 2025, 04:17
Wie kann ich Pandas am ersten Tag eines jeden Jahres in DataFrame erneut einproben

Last post by Anonymous « 04 Feb 2025, 23:13
Posted in Python

by Anonymous » 04 Feb 2025, 23:13 » in Python

Ich habe einen Datenrahmen, der tägliche Daten enthält
import pandas as pd
import numpy as np

# Set the random seed for reproducibility
np.random.seed(42)

# Generate random data
dates =...

0 Replies

23 Views

Last post by Anonymous
04 Feb 2025, 23:13

Return to “Python”