DQN -Aktionsauswahl - Sollte ich np.argmax (Optionen [0] [ - 1]) oder NP.Argmax (Optionen [0]) verwenden? - Programmiererforum

DQN -Aktionsauswahl - Sollte ich np.argmax (Optionen [0] [ - 1]) oder NP.Argmax (Optionen [0]) verwenden? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

DQN -Aktionsauswahl - Sollte ich np.argmax (Optionen [0] [ - 1]) oder NP.Argmax (Optionen [0]) verwenden?

Post by Anonymous » 07 Apr 2025, 05:46

Ich arbeite an der Implementierung eines Deep Q-Network (DQN) für einen Handelsbot mit Keras. Ich habe ein Modell, das Q-Werte für jede Aktion (sitzen, kaufen, verkaufen) voraussagt, und ich verwende np.argmax (), um die Aktion mit dem höchsten vorhergesagten q-Wert auszuwählen.

Code: Select all

action = np.argmax(options[0][-1])

Ich bin jedoch verwirrt, ob dies die richtige Möglichkeit ist, die beste Aktion auszuwählen, oder ob ich stattdessen verwenden sollte:

Code: Select all

action = np.argmax(options[0])

Die vollständige Act () -Methode sieht so aus:

Code: Select all

def act(self, state, inventory, is_eval=False):
if not is_eval and random.random()  self.epsilon_min:
self.epsilon *= self.epsilon_decay
< /code>
sollte ich verwenden: < /p>
action = np.argmax(options[0][-1])

oder

Code: Select all

action = np.argmax(options[0])

, um die beste Aktion basierend auf den q-Werten, die vom Modell ausgegeben wurden>

1743997604

Anonymous

Ich arbeite an der Implementierung eines Deep Q-Network (DQN) für einen Handelsbot mit Keras. Ich habe ein Modell, das Q-Werte für jede Aktion (sitzen, kaufen, verkaufen) voraussagt, und ich verwende np.argmax (), um die Aktion mit dem höchsten vorhergesagten q-Wert auszuwählen.[code]action = np.argmax(options[0][-1])[/code] 
Ich bin jedoch verwirrt, ob dies die richtige Möglichkeit ist, die beste Aktion auszuwählen, oder ob ich stattdessen verwenden sollte: 
[code]action = np.argmax(options[0])[/code] 
Die vollständige Act () -Methode sieht so aus: 
[code]def act(self, state, inventory, is_eval=False):
if not is_eval and random.random()  self.epsilon_min:
self.epsilon *= self.epsilon_decay
< /code>
sollte ich verwenden: < /p>
action = np.argmax(options[0][-1])[/code] 
oder 
[code]action = np.argmax(options[0])[/code] 
, um die beste Aktion basierend auf den q-Werten, die vom Modell ausgegeben wurden>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Neu in DQN und versuchen, ein Modell des Mondlanders (V3) auszubilden, aber meine Belohnungen steigen nicht und die Leis

Last post by Anonymous « 22 Mar 2025, 03:57
Posted in Python

by Anonymous » 22 Mar 2025, 03:57 » in Python

Ich bin sehr neu im Verstärkungslernen und beim Versuch, ein Modell für Lunar Lander für ein geführtes Projekt auszubilden, an dem ich arbeite. Aus der Trainingsgrafik (Belohnung vs Episode) kann ich...

0 Replies

14 Views

Last post by Anonymous
22 Mar 2025, 03:57
Wie sollte ich die Werte von nicht nullbaren und nullbaren Typen vergleichen, die in sollte?

Last post by Anonymous « 02 Feb 2025, 19:01
Posted in C#

by Anonymous » 02 Feb 2025, 19:01 » in C#

im folgenden Code, o .AccountEnabled hat bool wob br /> ohne den expliziten gegossenen zu bool? erhalte ich den folgenden Fehler:
'bool' does not contain a definition for 'ShouldBe' and the best...

0 Replies

31 Views

Last post by Anonymous
02 Feb 2025, 19:01
Wie man diese Unterklasse der abstrakten Klasse durchsetzen sollte, sollte eine bestimmte innere Klasse in Python defini

Last post by Guest « 11 Feb 2025, 07:17
Posted in Python

by Guest » 11 Feb 2025, 07:17 » in Python

Ich habe eine abstrakte Klasse, aus der Unterklassen abgeleitet werden. Die konkreten Implementierungen sollten eine Enum -Klasse enthalten, die einen Satz benannter Konstanten enthält.
from enum...

0 Replies

20 Views

Last post by Guest
11 Feb 2025, 07:17
Wie deaktivieren Sie die nicht ausgewählten Optionen für ein Mehrfachauswahlelement nicht ausgewählte Optionen?

Last post by Guest « 24 Feb 2025, 04:48
Posted in HTML

by Guest » 24 Feb 2025, 04:48 » in HTML

Ich arbeite am folgenden Tags -Selektor in JavaScript, ohne ein Plugin zu verwenden. -Code >
const tagsList = document.querySelector( .tags-list )
const tagActions = document.getElementById(...

0 Replies

15 Views

Last post by Guest
24 Feb 2025, 04:48
Wie deaktivieren Sie die nicht ausgewählten Optionen für ein Mehrfachauswahlelement nicht ausgewählte Optionen?

Last post by Guest « 24 Feb 2025, 04:48
Posted in CSS

by Guest » 24 Feb 2025, 04:48 » in CSS

Ich arbeite am folgenden Tags -Selektor in JavaScript, ohne ein Plugin zu verwenden. -Code >
const tagsList = document.querySelector( .tags-list )
const tagActions = document.getElementById(...

0 Replies

16 Views

Last post by Guest
24 Feb 2025, 04:48

Return to “Python”