Neu in DQN und versuchen, ein Modell des Mondlanders (V3) auszubilden, aber meine Belohnungen steigen nicht und die LeisPython

Python-Programme
Anonymous
 Neu in DQN und versuchen, ein Modell des Mondlanders (V3) auszubilden, aber meine Belohnungen steigen nicht und die Leis

Post by Anonymous »

Ich bin sehr neu im Verstärkungslernen und beim Versuch, ein Modell für Lunar Lander für ein geführtes Projekt auszubilden, an dem ich arbeite. Aus der Trainingsgrafik (Belohnung vs Episode) kann ich feststellen, dass die Leistung meines Modells wirklich keine Verbesserung gibt. Es bleibt in einer seltsamen lokalen Minima stecken, aus der es nicht herauskommen kann. Die Handlung sieht folgendermaßen aus:

Ich habe ein Jupyter -Notizbuch geschrieben, das das Projekt basiert, das das Projekt basiert, das das Projekt, das das Projekt verändert, das Projekt, in dem ich das Projekt verändert habe. Ist dies. Weil ich das Gefühl habe, für eine relativ Starterumgebung sollte die Leistung viel besser sein und mit der Zeit zunehmen, aber es geschieht hier nicht. (Ich habe mehrere verschiedene Parameter ausprobiert, die Modellarchitektur geändert, mit LR, EPS_DECAY gespielt, aber nichts scheint einen Unterschied zu diesem Verhalten zu machen.) Das wäre ein großer Gefallen und geholfen Ihnen, mir zu tun.
Vielen Dank für Ihre Zeit.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post