Code: Select all
LabelEncoder
Code: Select all
OneHotEncoder
Code: Select all
sklearn
Mein Problem entsteht, wenn ich einen neuen Kunden vorhersagen (klassifizieren) möchte (nur einer). Die Daten für den neuen Kunden sind immer noch nicht vorverarbeitet (d. H. Ländernamen sind nicht codiert). So etwas wie Folgendes: < /p>
Code: Select all
new_customer = np.array([['France', 600, 'Male', 40, 3, 60000, 2, 1,1, 50000]])
< /code>
Im Online-Kurs, in dem ich maschinelles Lernen lerne, öffnete der Ausbilder den vorverarbeiteten Datensatz mit den codierten Daten und [b] > [/b] Überprüft den Code für Frankreich und aktualisiert ihn im New_Customer
new_customer = np.array([[0, 0, 600, 'Male', 40, 3, 60000, 2, 1,1, 50000]])
< /code>
Ich glaube, dass dies nicht praktisch ist. Es muss eine Möglichkeit geben, Frankreich automatisch für denselben Code zu codieren, der im ursprünglichen Datensatz verwendet wird, oder zumindest eine Möglichkeit, a zurückzugeben Liste der Länder und ihrer codierten Werte. Manuell zu kodieren, erscheint das Erkodieren eines Etiketts langweilig und fehleranfällig. Wie kann ich diesen Vorgang automatisieren oder die Codes für die Etiketten generieren? Dank im Voraus.