Reproduzieren Sie LGBMRegressor-Vorhersagen, indem Sie die Werte manuell aggregieren

Reproduzieren Sie LGBMRegressor-Vorhersagen, indem Sie die Werte manuell aggregieren ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Reproduzieren Sie LGBMRegressor-Vorhersagen, indem Sie die Werte manuell aggregieren

Report
Quote

Post by Guest » 16 Jan 2025, 11:39

Ich versuche, die LGBMRegressor-Vorhersagen selbst zu reproduzieren. Wenn es mir gelingt, werde ich den Mittelwert durch den Median vertauschen. Aber im Moment scheint es mir nicht möglich zu sein.
Hier ist ein einfaches Skript, das ich erstellt habe, um zu überprüfen, ob ich die Ergebnisse reproduzieren kann.
Ich brauche reg_y_hat dasselbe sein wie self_y_hat.
Was fehlt mir? Wenn ich weiß, welche Stichproben im Zug auf jedes Blatt fallen, kann ich die Vorhersage selbst aggregieren ...

Code: Select all

import numpy as np
import lightgbm as lgb
from sklearn.model_selection import train_test_split

# Generate some random regression data
np.random.seed(42)
X = np.random.rand(100, 5)
y = 4 * X[:, 0] - 2 * X[:, 1] + np.random.rand(100) * 0.1

# Split the data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Train the LGBMRegressor
model = lgb.LGBMRegressor(objective='regression', n_estimators=10, learning_rate=0.1, random_state=42)
model.fit(X_train, y_train)

# Regular predict:
reg_y_hat = model.predict(X_test)

# Get the train leaf values
train_leaf_indices = model.predict(X_train, pred_leaf=True)
leaf_samples = {(i, leaf_id): [] for i in range(model.n_estimators) for leaf_id in np.unique(train_leaf_indices[:, i])}

# Store corresponding target values for each leaf
for i, row in enumerate(train_leaf_indices):
for j, leaf_id in enumerate(row):
leaf_samples[(j, leaf_id)].append(y_train[i])

# Compute avg for each leaf:
leaf_agg = {}
for key, values in leaf_samples.items():
leaf_agg[key] = np.mean(values)

# Predict by aggregating the mean values:
preds = []
test_leaf_indices = model.predict(X_test, pred_leaf=True)
for row_indices in test_leaf_indices:
row_pred = 0.0
for i, leaf_index in enumerate(row_indices):
row_pred += model.learning_rate * leaf_agg[(i, leaf_index)]
preds.append(row_pred)
self_y_hat = np.array(preds)

1737023954

Guest

Ich versuche, die LGBMRegressor-Vorhersagen selbst zu reproduzieren. Wenn es mir gelingt, werde ich den Mittelwert durch den Median vertauschen. Aber im Moment scheint es mir nicht möglich zu sein.
Hier ist ein einfaches Skript, das ich erstellt habe, um zu überprüfen, ob ich die Ergebnisse reproduzieren kann.
Ich brauche reg_y_hat dasselbe sein wie self_y_hat.
Was fehlt mir? Wenn ich weiß, welche Stichproben im Zug auf jedes Blatt fallen, kann ich die Vorhersage selbst aggregieren ...
[code]import numpy as np
import lightgbm as lgb
from sklearn.model_selection import train_test_split

# Generate some random regression data
np.random.seed(42)
X = np.random.rand(100, 5)
y = 4 * X[:, 0] - 2 * X[:, 1] + np.random.rand(100) * 0.1

# Split the data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Train the LGBMRegressor
model = lgb.LGBMRegressor(objective='regression', n_estimators=10, learning_rate=0.1, random_state=42)
model.fit(X_train, y_train)

# Regular predict:
reg_y_hat = model.predict(X_test)

# Get the train leaf values
train_leaf_indices = model.predict(X_train, pred_leaf=True)
leaf_samples = {(i, leaf_id): [] for i in range(model.n_estimators) for leaf_id in np.unique(train_leaf_indices[:, i])}

# Store corresponding target values for each leaf
for i, row in enumerate(train_leaf_indices):
for j, leaf_id in enumerate(row):
leaf_samples[(j, leaf_id)].append(y_train[i])

# Compute avg for each leaf:
leaf_agg = {}
for key, values in leaf_samples.items():
leaf_agg[key] = np.mean(values)

# Predict by aggregating the mean values:
preds = []
test_leaf_indices = model.predict(X_test, pred_leaf=True)
for row_indices in test_leaf_indices:
row_pred = 0.0
for i, leaf_index in enumerate(row_indices):
row_pred += model.learning_rate * leaf_agg[(i, leaf_index)]
preds.append(row_pred)
self_y_hat = np.array(preds)
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie aggregieren und summe ich basierend auf einer Spalte in Pandas? [Duplikat]

Last post by Anonymous « 20 Feb 2025, 22:50
Posted in Python

by Anonymous » 20 Feb 2025, 22:50 » in Python

Ich habe einige Daten in einem CSV -Format, in dem Elemente unter einer bestimmten Kategorie und deren Zählung verfolgt werden. Wie gruppiere ich basierend auf der Kategorie und addiere alle Zahlen...

0 Replies

16 Views

Last post by Anonymous
20 Feb 2025, 22:50
Reproduzieren Sie die NullPointerException in der Stream.toList()-Methode

Last post by Guest « 05 Jan 2025, 04:38
Posted in Java

by Guest » 05 Jan 2025, 04:38 » in Java

Ich habe herausgefunden, wie ich die NullPointerException (NPE) reproduzieren kann, die ich in der Protokollierung gesehen habe.
Der Stacktrace zeigt auf die Zeile von Stream.toList() -Methode in der...

0 Replies

33 Views

Last post by Guest
05 Jan 2025, 04:38
Fügen Sie Einträge im lokalen Speicher des mobilen Browsers manuell hinzu oder bearbeiten Sie manuell

Last post by Anonymous « 05 Apr 2025, 21:05
Posted in Android

by Anonymous » 05 Apr 2025, 21:05 » in Android

Ich möchte manuell (nicht programmgesteuert) einen Eintrag in einem lokalen Speicher eines mobilen (Android) Browsers hinzufügen oder bearbeiten. Ich weiß, wie man das auf einem Desktop-Browser...

0 Replies

28 Views

Last post by Anonymous
05 Apr 2025, 21:05
Wie vermeiden Sie es, VM -Optionen manuell hinzuzufügen und den Code funktionieren, indem Sie POM.xml Abhängigkeiten hin

Last post by Guest « 28 Jan 2025, 06:56
Posted in Java

by Guest » 28 Jan 2025, 06:56 » in Java

Ich habe ein Projekt, bei dem bestimmte Funktionen des Codes die folgenden VM -Optionen in der Intellij -Idee manuell hinzugefügt werden:
--add-opens java.base/java.time=ALL-UNNAMED
--add-opens...

0 Replies

22 Views

Last post by Guest
28 Jan 2025, 06:56
Kann das Experiment über den RA -Modus von J9mm nicht reproduzieren

Last post by Anonymous « 13 May 2025, 05:11
Posted in Java

by Anonymous » 13 May 2025, 05:11 » in Java

Ich habe versucht, das Experiment über Release/Accire aus Doug Lea's Blog auf J9mm (
volatile int ready; // Initially 0, with VarHandle READY
int dinner; // mode does not matter here

Thread 1 |...

0 Replies

13 Views

Last post by Anonymous
13 May 2025, 05:11

Return to “Python”