Warum liefert RandomizedSearchCV manchmal schlechtere Ergebnisse als die manuelle Optimierung in scikit-learn? - Programmiererforum

Warum liefert RandomizedSearchCV manchmal schlechtere Ergebnisse als die manuelle Optimierung in scikit-learn? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Warum liefert RandomizedSearchCV manchmal schlechtere Ergebnisse als die manuelle Optimierung in scikit-learn?

Report
Quote

Post by Anonymous » 15 Nov 2025, 23:59

Ich arbeite an einem Klassifizierungsproblem mit dem RandomForestClassifier von scikit-learn. Ich habe versucht, RandomizedSearchCV für die Optimierung von Hyperparametern zu verwenden, aber die Ergebnisse waren schlechter als wenn ich die Parameter manuell basierend auf Intuition und Versuch/Irrtum eingestellt habe.
Hier ist eine vereinfachte Version meines Codes:

Code: Select all

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV

param_dist = {
"n_estimators": [100, 200, 300],
"max_depth": [None, 10, 20, 30],
"min_samples_split": [2, 5, 10],
"min_samples_leaf": [1, 2, 4],
}

clf = RandomForestClassifier(random_state=42)
random_search = RandomizedSearchCV(clf, param_distributions=param_dist, n_iter=10, cv=5, scoring='accuracy')
random_search.fit(X_train, y_train)

In mehreren Durchläufen liefert dieser Ansatz Modelle mit geringerer Genauigkeit auf meinem Testsatz als mein manuell abgestimmtes Modell.
Was sind häufige Fallstricke bei der Verwendung von RandomizedSearchCV?
Wie kann ich Reproduzierbarkeit und Robustheit des Optimierungsprozesses sicherstellen?

1763247595

Anonymous

Ich arbeite an einem Klassifizierungsproblem mit dem RandomForestClassifier von scikit-learn. Ich habe versucht, RandomizedSearchCV für die Optimierung von Hyperparametern zu verwenden, aber die Ergebnisse waren schlechter als wenn ich die Parameter manuell basierend auf Intuition und Versuch/Irrtum eingestellt habe.
Hier ist eine vereinfachte Version meines Codes:
[code]from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV

param_dist = {
"n_estimators": [100, 200, 300],
"max_depth": [None, 10, 20, 30],
"min_samples_split": [2, 5, 10],
"min_samples_leaf": [1, 2, 4],
}

clf = RandomForestClassifier(random_state=42)
random_search = RandomizedSearchCV(clf, param_distributions=param_dist, n_iter=10, cv=5, scoring='accuracy')
random_search.fit(X_train, y_train)
[/code]
In mehreren Durchläufen liefert dieser Ansatz Modelle mit geringerer Genauigkeit auf meinem Testsatz als mein manuell abgestimmtes Modell.
Was sind häufige Fallstricke bei der Verwendung von RandomizedSearchCV?
Wie kann ich Reproduzierbarkeit und Robustheit des Optimierungsprozesses sicherstellen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Scikit-Learn, erzwingen Sie teilweise Löser der kleinsten Quadrate, nur positive Ergebnisse zu berücksichtigen

Last post by Anonymous « 24 Feb 2025, 13:12
Posted in Python

by Anonymous » 24 Feb 2025, 13:12 » in Python

Ich verwende den Löser der teilweisen kleinsten Quadrate (PLS) zur Datenanalyse mehrerer überlagerter spektraler Signale. Manchmal bekomme ich einige der schwächeren Signale als negative Werte, die...

0 Replies

52 Views

Last post by Anonymous
24 Feb 2025, 13:12
So behalten Sie die Spaltenscheiben des Datenrahmens nach der Vorverarbeitung in Scikit-Learn

Last post by Anonymous « 20 Mar 2025, 14:25
Posted in Python

by Anonymous » 20 Mar 2025, 14:25 » in Python

Ich habe einen Pandas -Datenrahmen, der einige Zeilen und Spalten enthält. Jede Spalte hat einen Header. Solange ich in Pandas weiterhin Datenmanipulationsoperationen durchnehme, bleiben meine...

0 Replies

34 Views

Last post by Anonymous
20 Mar 2025, 14:25
Wie verwende ich RFECV für die Feature-Auswahl in einer Scikit-Learn-Pipeline mit einem einfachen Entscheidungsbaum rich

Last post by Anonymous « 03 Apr 2025, 07:57
Posted in Python

by Anonymous » 03 Apr 2025, 07:57 » in Python

Ich arbeite am Kaggle House Price Price Prediction-Wettbewerb und habe eine Scikit-Learn-Pipeline gebaut, die:
Vorverarbeitung (Handhabung fehlender Werte, Skalierung, Codierung) Feature Engineering...

0 Replies

43 Views

Last post by Anonymous
03 Apr 2025, 07:57
Verschachtelte Cross-Validation-Beispiel für Scikit-Learn

Last post by Anonymous « 28 Feb 2025, 07:05
Posted in Python

by Anonymous » 28 Feb 2025, 07:05 » in Python

Ich versuche, meinen Kopf im Beispiel von verschachtelten und nicht Nestnestnern in Sklearn zu arbeiten. Ich habe mehrere Antworten überprüft, aber ich bin immer noch verwirrt mit dem Beispiel. Aus...

0 Replies

36 Views

Last post by Anonymous
28 Feb 2025, 07:05
Tokenisierungstext mit Scikit-Learn

Last post by Anonymous « 09 Mar 2025, 13:01
Posted in Python

by Anonymous » 09 Mar 2025, 13:01 » in Python

Ich habe den folgenden Code, um Funktionen aus einer Reihe von Dateien zu extrahieren (Ordnername ist der Kategorienname) für die Textklassifizierung.

import sklearn.datasets
from...

0 Replies

27 Views

Last post by Anonymous
09 Mar 2025, 13:01

Return to “Python”