Multithreading für Daten von DataFrame PandasPython

Python-Programme
Anonymous
 Multithreading für Daten von DataFrame Pandas

Post by Anonymous »

ein Ich habe also einen Pandas -Datenrahmen besteht aus 1.000 Kunden, was bedeutet, dass ich die Verwandtschaft 1 Million Mal berechnen muss, und dies dauert zu lange, um < /p>
ein Beispiel für den Datenrahmen zu verarbeiten Dies: < /p>

Code: Select all

  ID     Item
1    Banana
1    Apple
2    Orange
2    Banana
2    Tomato
3    Apple
3    Tomato
3    Orange
Hier ist die vereinfachte Version des Code:

Code: Select all

import pandas as pd

def relatedness (customer1, customer2):
# do some calculations to measure the relation between the customers

data= pd.read_csv(data_file)
customers_list= list (set(data['ID']))

relatedness_matrix = pd.DataFrame(index=[customers_list], columns=[customers_list])
for i in customers_list:
for j in customer_list:
relatedness_matrix.loc[i,j] = relatedness (i,j)

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post