Wie kann man Multivalue -Attribute in einem Datenrahmen vorbereiten?

Post a reply

Smilies
:) :( :oops: :chelo: :roll: :wink: :muza: :sorry: :angel: :read: *x) :clever:
View more smilies

BBCode is ON
[img] is ON
[flash] is OFF
[url] is ON
Smilies are ON

Topic review
   

Expand view Topic review: Wie kann man Multivalue -Attribute in einem Datenrahmen vorbereiten?

by Anonymous » 03 Apr 2025, 04:53

Beschreibung: < /strong> < /p>
  • Eingabe ist eine CSV -Datei. Spalten. Das Minimum beträgt 1, maximal 5 Werte. The input is similar to this:




Job Perks
Insurance Benefits




Online -Kurse; Zertifizierungsprogramme; Cross Training < /td>
Lebensversicherung; Zahnversicherung < /td>
< /tr>

Führungskräfteentwicklungsprogramme; Online -Kurse < /td>
Lebensversicherung; Unfallversicherung < /td>
< /tr>
< /tbody>
< /table> < /div>

Multivalue erwartete Ausgabe: < /li>
< /ol>
Job Perks_Online Courses
Job Perks_Certification Programs
Job Perks_Cross Training
Job Perks_Leadership Development Programs
Insurance Benefits_Life Insurance
Insurance Benefits_Dental Insurance
Insurance Benefits_Accident Insurance




1
1
1
0
1
1
0


1
0
0
1
1
0 < /td>
1 < /td>
< /tr>
< /tbody>
< /table> < /div>

Wie kann ich den CSV -Eingang vorab vorab und retten Sie es mit der oben erwarteten Ausgabe mit der DataFrame mit der DataFrame mit der DataFrame mit der DataFrame mit der DataFrame mit der DataFrame mit der DataFrame. Ich bin in der Lage, nominelle Attribute in die erwartete Ausgabe (Beispielcode unten) vorzubereiten, aber es findet es schwierig, Multivalues ​​zu konvertieren. https://github.com/omnislayer/workdatas ... edited.csv
Beispielcode:

Code: Select all

#For the nominal:
import pandas as pd
import numpy as np
import dtale #Better STDOUT for dataframes

nominalColumns = ["Gender", "Marital Status", "Educational Attainment", "Employment Status", "Company Bonus Structure", "Company Medical Plan Type"]
multivalueColumns = ["Job Perks", "Professional Development Opportunities", "Insurance Benefits"]

df = pd.read_csv('ECP_Unedited.csv')

#Convert Nominal Columns
newCols = pd.get_dummies(df[nominalColumns], dtype=int)
df = df.drop(columns=nominalColumns)
df = pd.concat([df, newCols], axis=1)
dtale.show(df)

#Convert Multivalue Columns
#INSERT CODE HERE!


Top