Wie kann ich eine in einer CSV-Datei gespeicherte Sparse-Matrix einlesen? (Python 3.6.4)Python

Python-Programme
Anonymous
 Wie kann ich eine in einer CSV-Datei gespeicherte Sparse-Matrix einlesen? (Python 3.6.4)

Post by Anonymous »

Mit countvectorizer habe ich Feature-Vektoren aus Tausenden von E-Mails extrahiert und in einer CSV-Datei gespeichert

Code: Select all

dictionary = open (r'''C:\Users\User\Desktop\csmp3\stemmedDictionary.txt''',"r")
dic = list(set(dictionary.read().splitlines()))
cv = CountVectorizer(vocabulary = dic, binary = True)
#~PRESENCE FEATURE VECTOR~#
#TRAIN
pdt = open (r'''C:\Users\User\Desktop\csmp3\presence-dataset-training-stemmed.csv''',"w")
matWriter = csv.writer(pdt,delimiter = ',')

for i in range (1,2): #45252
processed_email = open(r'''C:\Users\User\Desktop\csmp3\processed\processed'''+str(i)+'''.txt''',"r")
presence_array = cv.transform(processed_email)

matWriter.writerow(presence_array)
processed_email.close()
pdt.close()
Dies ist Teil eines Spam-Filterung mit Naive Bayes-Projekts und unser Datensatz ist ziemlich groß. Ich hoffe, diese dünn besetzte Matrix für die Partial-Fit-Methode von Bernoulli Naive Bayes verwenden zu können. Ich kann einfach nicht ganz herausfinden, wie ich die Sparse-Matrix aus der Datei laden soll. Ich habe numpy.loadtxt bereits ausprobiert, aber es kommt zu folgendem Ergebnis:

ValueError: string konnte nicht in Float konvertiert werden

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post