Überanpassung in den Zugdaten für einen Kunden -Abwanderungsdatensatz

Überanpassung in den Zugdaten für einen Kunden -Abwanderungsdatensatz ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Überanpassung in den Zugdaten für einen Kunden -Abwanderungsdatensatz

Post by Anonymous » 03 Mar 2025, 17:36

Ich lerne ein grundlegendes maschinelles Lernen für Klassifizierungszwecke. Ich habe ein logistisches Regressionsmodell auf einem Kundenbahnen-Datensatz von Kaggle (https://www.kaggle.com/datasets/Muhamma ... mer-churn-) trainiert. Ich habe jedoch einen schweren Fall von Überanpassung: 
Zuggenauigkeit: 0,94 
Testgenauigkeit: 0,57 
Dies zeigt an, dass mein Modell schlecht verallgemeinert wird. Zusätzlich habe ich eine Hyperparameter-Abstimmung mit geschichteten k-fachen Kreuzvalidierung verwendet, um die Modellparameter zu optimieren.Train_data = 'customer-churn-dataset-training-master.csv'
Test_data = 'customer-churn-dataset-testing-master.csv'
< /code>
Pipeline -Setup 
ordinal_encoded_features = ['Subscription Type', 'Contract Length']
label_encoded_features = ['Gender']

ordinal_cat = [
['Basic', 'Standard', 'Premium'],
['Monthly', 'Quarterly', 'Annual']
]

preprocessor = ColumnTransformer([
('onehot', OneHotEncoder(handle_unknown='ignore', drop='first'), label_encoded_features),
('ordinal', OrdinalEncoder(categories=ordinal_cat, handle_unknown='use_encoded_value', unknown_value=-1),
ordinal_encoded_features)
], remainder='passthrough')

Log_pipeline = {
'Logistic Regression': Pipeline([
('preprocessor', preprocessor),
('scaler', MinMaxScaler()),
('classifier', LogisticRegression(random_state=42))
])
}
< /code>
Hyperparameter-Tuning mit geschichteten k-fach 
param_grid = {
'Logistic Regression': {
'classifier__C': [0.1, 1, 5, 10, 15, 20],
'classifier__penalty': ['l1', 'l2'],
'classifier__solver': ['liblinear', 'saga'],
'classifier__class_weight': [None, 'balanced']
}
}

kf = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)
log_model = {}
best_score = {}

for name, pipe in Log_pipeline.items():
Random_search = RandomizedSearchCV(pipe, param_grid[name], cv=kf, scoring='f1', n_jobs=-1,
random_state=42, n_iter=20)
Random_search.fit(x_train, y_train)

log_model[name] = Random_search.best_estimator_
best_score[name] = Random_search.best_score_
< /code>
Was ich ausprobiert habe: 
Verwendete MinmaxScaler für Feature-Skalierung. Genauigkeit. Gibt es Verbesserungen, die ich vornehmen kann, um die Generalisierungsleistung zu verbessern?

1741019768

Anonymous

Ich lerne ein grundlegendes maschinelles Lernen für Klassifizierungszwecke. Ich habe ein logistisches Regressionsmodell auf einem Kundenbahnen-Datensatz von Kaggle (https://www.kaggle.com/datasets/Muhammadshahidazeem/Customer-churn-) trainiert. Ich habe jedoch einen schweren Fall von Überanpassung: < /p>
Zuggenauigkeit: 0,94 < /p>
Testgenauigkeit: 0,57 < /p>
Dies zeigt an, dass mein Modell schlecht verallgemeinert wird. Zusätzlich habe ich eine Hyperparameter-Abstimmung mit geschichteten k-fachen Kreuzvalidierung verwendet, um die Modellparameter zu optimieren.Train_data = 'customer-churn-dataset-training-master.csv'
Test_data = 'customer-churn-dataset-testing-master.csv'
< /code>
Pipeline -Setup < /p>
ordinal_encoded_features = ['Subscription Type', 'Contract Length']
label_encoded_features = ['Gender']

ordinal_cat = [
['Basic', 'Standard', 'Premium'],
['Monthly', 'Quarterly', 'Annual']
]

preprocessor = ColumnTransformer([
('onehot', OneHotEncoder(handle_unknown='ignore', drop='first'), label_encoded_features),
('ordinal', OrdinalEncoder(categories=ordinal_cat, handle_unknown='use_encoded_value', unknown_value=-1),
ordinal_encoded_features)
], remainder='passthrough')

Log_pipeline = {
'Logistic Regression': Pipeline([
('preprocessor', preprocessor),
('scaler', MinMaxScaler()),
('classifier', LogisticRegression(random_state=42))
])
}
< /code>
Hyperparameter-Tuning mit geschichteten k-fach < /p>
param_grid = {
'Logistic Regression': {
'classifier__C': [0.1, 1, 5, 10, 15, 20],
'classifier__penalty': ['l1', 'l2'],
'classifier__solver': ['liblinear', 'saga'],
'classifier__class_weight': [None, 'balanced']
}
}

kf = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)
log_model = {}
best_score = {}

for name, pipe in Log_pipeline.items():
Random_search = RandomizedSearchCV(pipe, param_grid[name], cv=kf, scoring='f1', n_jobs=-1,
random_state=42, n_iter=20)
Random_search.fit(x_train, y_train)

log_model[name] = Random_search.best_estimator_
best_score[name] = Random_search.best_score_
< /code>
Was ich ausprobiert habe: < /p>
Verwendete MinmaxScaler für Feature-Skalierung. Genauigkeit. Gibt es Verbesserungen, die ich vornehmen kann, um die Generalisierungsleistung zu verbessern?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Optimierung der Abfrageausführung für den Umgang mit doppelten Kunden-IDs

Last post by Guest « 05 Jan 2025, 17:06
Posted in Java

by Guest » 05 Jan 2025, 17:06 » in Java

Ich habe ein Schema ähnlich dem gezeigten und muss Transaktionsinformationen abrufen.
.sstatic.net/xVhLpCri.jpg

Ich möchte Datensätze aus der CUSTOMER-Tabelle mit denen in der TRANSACTION-Tabelle...

0 Replies

10 Views

Last post by Guest
05 Jan 2025, 17:06
Optimierung der Abfrageausführung für den Umgang mit doppelten Kunden-IDs

Last post by Guest « 07 Jan 2025, 13:02
Posted in Java

by Guest » 07 Jan 2025, 13:02 » in Java

Ich habe ein Schema ähnlich dem gezeigten und muss Transaktionsinformationen abrufen.
.sstatic.net/xVhLpCri.jpg

Ich möchte Datensätze aus der CUSTOMER-Tabelle mit denen in der TRANSACTION-Tabelle...

0 Replies

8 Views

Last post by Guest
07 Jan 2025, 13:02
NPE beim Senden von SendbackgroundAcommand an den FreeSwitch -Kunden

Last post by Guest « 12 Feb 2025, 07:32
Posted in Java

by Guest » 12 Feb 2025, 07:32 » in Java

Ich habe den FreeSwitch-Client von heruntergeladen, und ich konnte es ohne Fehler mit Java 17 erstellen. Ich erhalte jedoch jedes Mal, wenn ich versuche, auszuführen sendbackgroundAPICommand () ....

0 Replies

8 Views

Last post by Guest
12 Feb 2025, 07:32
NPE beim Senden von SendbackgroundAcommand an den FreeSwitch -Kunden

Last post by Anonymous « 13 Feb 2025, 19:44
Posted in Java

by Anonymous » 13 Feb 2025, 19:44 » in Java

Ich habe den FreeSwitch-Client von heruntergeladen, und ich konnte es ohne Fehler mit Java 17 erstellen. Ich erhalte jedoch jedes Mal, wenn ich versuche, auszuführen sendbackgroundAPICommand () ....

0 Replies

4 Views

Last post by Anonymous
13 Feb 2025, 19:44
Flutter -App, die nicht ordnungsgemäß zwischen den Bildschirmen des Kunden- und Dienstanbieters unterscheidet

Last post by Anonymous « 13 Apr 2025, 01:06
Posted in Android

by Anonymous » 13 Apr 2025, 01:06 » in Android

Ich habe Probleme mit meiner Flutter -App, die verschiedene Bildschirme für Kunden und Dienstleister nicht ordnungsgemäß rendert. Hier sind die Schlüsselprobleme:

Kunden -E -Mails können sich bei...

0 Replies

3 Views

Last post by Anonymous
13 Apr 2025, 01:06

Return to “Python”