Multithreading für Daten von DataFrame Pandas

Multithreading für Daten von DataFrame Pandas ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Multithreading für Daten von DataFrame Pandas

Post by Anonymous » 11 Feb 2025, 23:49

ein Ich habe also einen Pandas -Datenrahmen besteht aus 1.000 Kunden, was bedeutet, dass ich die Verwandtschaft 1 Million Mal berechnen muss, und dies dauert zu lange, um < /p>
ein Beispiel für den Datenrahmen zu verarbeiten Dies: < /p>

Code: Select all

  ID     Item
1    Banana
1    Apple
2    Orange
2    Banana
2    Tomato
3    Apple
3    Tomato
3    Orange

Hier ist die vereinfachte Version des Code:

Code: Select all

import pandas as pd

def relatedness (customer1, customer2):
# do some calculations to measure the relation between the customers

data= pd.read_csv(data_file)
customers_list= list (set(data['ID']))

relatedness_matrix = pd.DataFrame(index=[customers_list], columns=[customers_list])
for i in customers_list:
for j in customer_list:
relatedness_matrix.loc[i,j] = relatedness (i,j)

1739314170

Anonymous

ein Ich habe also einen Pandas -Datenrahmen besteht aus 1.000 Kunden, was bedeutet, dass ich die Verwandtschaft 1 Million Mal berechnen muss, und dies dauert zu lange, um < /p>
ein Beispiel für den Datenrahmen zu verarbeiten Dies: < /p>
[code]  ID     Item
1    Banana
1    Apple
2    Orange
2    Banana
2    Tomato
3    Apple
3    Tomato
3    Orange
[/code]
Hier ist die vereinfachte Version des Code: 
[code]import pandas as pd

def relatedness (customer1, customer2):
# do some calculations to measure the relation between the customers

data= pd.read_csv(data_file)
customers_list= list (set(data['ID']))

relatedness_matrix = pd.DataFrame(index=[customers_list], columns=[customers_list])
for i in customers_list:
for j in customer_list:
relatedness_matrix.loc[i,j] = relatedness (i,j)
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Ersetzen Sie die Werte in Pandas DataFrame anhand eines anderen DataFrame als Nachschlagetabelle

Last post by Anonymous « 30 Apr 2025, 21:24
Posted in Python

by Anonymous » 30 Apr 2025, 21:24 » in Python

Ich möchte Werte in einem Datenrahmen durch die Werte in einem zweiten Datenrahmen ersetzen, indem ich die Werte im ersten Datenrahmen mit den Spalten aus dem zweiten Datenrahmen übereinstimmt....

0 Replies

4 Views

Last post by Anonymous
30 Apr 2025, 21:24
Wie kann ich für Multi-Index-Spalten in Pandas DataFrame einen bestimmten Levelwert für die Visualisierung in Python gru

Last post by Anonymous « 11 Apr 2025, 21:03
Posted in Python

by Anonymous » 11 Apr 2025, 21:03 » in Python

Ich habe einen PANDAS -Datenfream, der im Grunde eine Pivot -Tabelle ist.
df.plot(kind = bar ,stacked = True) führt zum folgenden Diagramm. Die Bezeichnungen in der x-Achse sind wie gezeigt...

0 Replies

16 Views

Last post by Anonymous
11 Apr 2025, 21:03
Filterung von Pandas DataFrame für gleichmäßige oder ungerade Int -Werte

Last post by Anonymous « 03 Mar 2025, 17:48
Posted in Python

by Anonymous » 03 Mar 2025, 17:48 » in Python

Ich versuche, einen Datenrahmen zu filtern, wenn die Spalte sogar oder ungerade Werte enthält. Zum Beispiel möchte ich diese Tabelle:

a

So sehen Sie bei, wenn Sie für Punktzahl filtern....

0 Replies

13 Views

Last post by Anonymous
03 Mar 2025, 17:48
Summieren von Spalten von Pandas DataFrame auf systematische Weise

Last post by Anonymous « 23 Apr 2025, 10:54
Posted in Python

by Anonymous » 23 Apr 2025, 10:54 » in Python

Ich habe einen Pandas -Datenframe, der so aussieht:
1_2 1_3 1_4 2_3 2_4 3_4
1 5 2 8 2 2
4 3 4 5 8 5
8 8 8 9 3 3
4 3 4 4 8 3
8 0 7 4 2 2

wobei die Spalten die 4C2 -Kombinationen von 1,2,3,4 sind....

0 Replies

7 Views

Last post by Anonymous
23 Apr 2025, 10:54
Wie finde ich das Datum von 52 Wochen hoch und Datum von 52 Wochen niedrig mit Pandas DataFrame (Python)?

Last post by Anonymous « 01 Jul 2025, 13:08
Posted in Python

by Anonymous » 01 Jul 2025, 13:08 » in Python

Bitte siehe Tabelle unter der Referenz
Ich konnte 52 Wochen hoch und niedrig finden.
df = pd.read_csv(csv_file_name, engine='python')
df = df .rolling(window=252, center=False).max()
df = df...

0 Replies

12 Views

Last post by Anonymous
01 Jul 2025, 13:08

Return to “Python”