Neu in DQN und versuchen, ein Modell des Mondlanders (V3) auszubilden, aber meine Belohnungen steigen nicht und die Leis

Neu in DQN und versuchen, ein Modell des Mondlanders (V3) auszubilden, aber meine Belohnungen steigen nicht und die Leis ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Neu in DQN und versuchen, ein Modell des Mondlanders (V3) auszubilden, aber meine Belohnungen steigen nicht und die Leis

Post by Anonymous » 22 Mar 2025, 03:57

Ich bin sehr neu im Verstärkungslernen und beim Versuch, ein Modell für Lunar Lander für ein geführtes Projekt auszubilden, an dem ich arbeite. Aus der Trainingsgrafik (Belohnung vs Episode) kann ich feststellen, dass die Leistung meines Modells wirklich keine Verbesserung gibt. Es bleibt in einer seltsamen lokalen Minima stecken, aus der es nicht herauskommen kann. Die Handlung sieht folgendermaßen aus:

Ich habe ein Jupyter -Notizbuch geschrieben, das das Projekt basiert, das das Projekt basiert, das das Projekt, das das Projekt verändert, das Projekt, in dem ich das Projekt verändert habe. Ist dies. Weil ich das Gefühl habe, für eine relativ Starterumgebung sollte die Leistung viel besser sein und mit der Zeit zunehmen, aber es geschieht hier nicht. (Ich habe mehrere verschiedene Parameter ausprobiert, die Modellarchitektur geändert, mit LR, EPS_DECAY gespielt, aber nichts scheint einen Unterschied zu diesem Verhalten zu machen.) Das wäre ein großer Gefallen und geholfen Ihnen, mir zu tun.
Vielen Dank für Ihre Zeit.

1742612235

Anonymous

Ich bin sehr neu im Verstärkungslernen und beim Versuch, ein Modell für Lunar Lander für ein geführtes Projekt auszubilden, an dem ich arbeite. Aus der Trainingsgrafik (Belohnung vs Episode) kann ich feststellen, dass die Leistung meines Modells wirklich keine Verbesserung gibt. Es bleibt in einer seltsamen lokalen Minima stecken, aus der es nicht herauskommen kann. Die Handlung sieht folgendermaßen aus: 
 
Ich habe ein Jupyter -Notizbuch geschrieben, das das Projekt basiert, das das Projekt basiert, das das Projekt, das das Projekt verändert, das Projekt, in dem ich das Projekt verändert habe. Ist dies. Weil ich das Gefühl habe, für eine relativ Starterumgebung sollte die Leistung viel besser sein und mit der Zeit zunehmen, aber es geschieht hier nicht. (Ich habe mehrere verschiedene Parameter ausprobiert, die Modellarchitektur geändert, mit LR, EPS_DECAY gespielt, aber nichts scheint einen Unterschied zu diesem Verhalten zu machen.) Das wäre ein großer Gefallen und geholfen Ihnen, mir zu tun. 
Vielen Dank für Ihre Zeit.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

DQN -Aktionsauswahl - Sollte ich np.argmax (Optionen [0] [ - 1]) oder NP.Argmax (Optionen [0]) verwenden?

Last post by Anonymous « 07 Apr 2025, 05:46
Posted in Python

by Anonymous » 07 Apr 2025, 05:46 » in Python

Ich arbeite an der Implementierung eines Deep Q-Network (DQN) für einen Handelsbot mit Keras. Ich habe ein Modell, das Q-Werte für jede Aktion (sitzen, kaufen, verkaufen) voraussagt, und ich verwende...

0 Replies

2 Views

Last post by Anonymous
07 Apr 2025, 05:46
So steigen Sie zweimal im Vektor > inkrementiert.

Last post by Anonymous « 09 Apr 2025, 01:51
Posted in C++

by Anonymous » 09 Apr 2025, 01:51 » in C++

Ich habe einen Paarvektor.
vector
> myVector = {{X1, Y1}, {X2, Y2}, {X3, Y3}, {X4,Y4}, ....};
Sagen wir, ich möchte darüber iterieren, so dass eine Funktion in der zweiten Iteration usw. mit dem...

0 Replies

3 Views

Last post by Anonymous
09 Apr 2025, 01:51
Wie versuchen Sie, die Warnung nach dem Betrachten neu zu laden?

Last post by Guest « 08 Feb 2025, 13:36
Posted in JavaScript

by Guest » 08 Feb 2025, 13:36 » in JavaScript

Wenn dieser Code ausgeführt wird, wird diese Warnung nicht angezeigt, wenn die Seite nachgeladen wird. Ich möchte die Seite neu laden, nachdem der Alarm angezeigt wird.
// sweetalert framework...

0 Replies

2 Views

Last post by Guest
08 Feb 2025, 13:36
Modell. [Ein Modell] .Tolist () kehrt Null zurück

Last post by Anonymous « 14 Apr 2025, 20:14
Posted in C#

by Anonymous » 14 Apr 2025, 20:14 » in C#

Ich übertrage ein Repository an die Ansicht als mein Modell und in der Ansicht, mit dem Repository, kann ich einen Eintrag in die DB einfügen. Ich kann den Eintrag in der DB sehen, aber wenn ich...

0 Replies

4 Views

Last post by Anonymous
14 Apr 2025, 20:14
Ich versuche, ein Wörterbuch zu sortieren, es aber auch neu zu indizieren, sodass die Indizes in aufsteigender Reihenfol

Last post by Guest « 03 Jan 2025, 12:52
Posted in Python

by Guest » 03 Jan 2025, 12:52 » in Python

Ich versuche, ein Wörterbuch zu sortieren, es aber auch neu zu indizieren (oder zu sortieren), sodass die Indizes in aufsteigender Reihenfolge vorliegen.
import operator
sorted_nums = {}
nums =...

0 Replies

8 Views

Last post by Guest
03 Jan 2025, 12:52

Return to “Python”