DQN -Aktionsauswahl - Sollte ich np.argmax (Optionen [0] [ - 1]) oder NP.Argmax (Optionen [0]) verwenden? - Programmiererforum

DQN -Aktionsauswahl - Sollte ich np.argmax (Optionen [0] [ - 1]) oder NP.Argmax (Optionen [0]) verwenden? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

DQN -Aktionsauswahl - Sollte ich np.argmax (Optionen [0] [ - 1]) oder NP.Argmax (Optionen [0]) verwenden?

Report
Quote

Post by Anonymous » 07 Apr 2025, 05:46

Ich arbeite an der Implementierung eines Deep Q-Network (DQN) für einen Handelsbot mit Keras. Ich habe ein Modell, das Q-Werte für jede Aktion (sitzen, kaufen, verkaufen) voraussagt, und ich verwende np.argmax (), um die Aktion mit dem höchsten vorhergesagten q-Wert auszuwählen.

Code: Select all

action = np.argmax(options[0][-1])

Ich bin jedoch verwirrt, ob dies die richtige Möglichkeit ist, die beste Aktion auszuwählen, oder ob ich stattdessen verwenden sollte:

Code: Select all

action = np.argmax(options[0])

Die vollständige Act () -Methode sieht so aus:

Code: Select all

def act(self, state, inventory, is_eval=False):
if not is_eval and random.random()  self.epsilon_min:
self.epsilon *= self.epsilon_decay
< /code>
sollte ich verwenden: < /p>
action = np.argmax(options[0][-1])

oder

Code: Select all

action = np.argmax(options[0])

, um die beste Aktion basierend auf den q-Werten, die vom Modell ausgegeben wurden>

1743997604

Anonymous

Ich arbeite an der Implementierung eines Deep Q-Network (DQN) für einen Handelsbot mit Keras. Ich habe ein Modell, das Q-Werte für jede Aktion (sitzen, kaufen, verkaufen) voraussagt, und ich verwende np.argmax (), um die Aktion mit dem höchsten vorhergesagten q-Wert auszuwählen.[code]action = np.argmax(options[0][-1])[/code] 
Ich bin jedoch verwirrt, ob dies die richtige Möglichkeit ist, die beste Aktion auszuwählen, oder ob ich stattdessen verwenden sollte: 
[code]action = np.argmax(options[0])[/code] 
Die vollständige Act () -Methode sieht so aus: 
[code]def act(self, state, inventory, is_eval=False):
if not is_eval and random.random()  self.epsilon_min:
self.epsilon *= self.epsilon_decay
< /code>
sollte ich verwenden: < /p>
action = np.argmax(options[0][-1])[/code] 
oder 
[code]action = np.argmax(options[0])[/code] 
, um die beste Aktion basierend auf den q-Werten, die vom Modell ausgegeben wurden>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Neu in DQN und versuchen, ein Modell des Mondlanders (V3) auszubilden, aber meine Belohnungen steigen nicht und die Leis

Last post by Anonymous « 22 Mar 2025, 03:57
Posted in Python

by Anonymous » 22 Mar 2025, 03:57 » in Python

Ich bin sehr neu im Verstärkungslernen und beim Versuch, ein Modell für Lunar Lander für ein geführtes Projekt auszubilden, an dem ich arbeite. Aus der Trainingsgrafik (Belohnung vs Episode) kann ich...

0 Replies

36 Views

Last post by Anonymous
22 Mar 2025, 03:57
Wann sollte ich PowerShell.AddCommand() und wann sollte ich PowerShell.AddScript() verwenden?

Last post by Anonymous « 10 Oct 2025, 08:50
Posted in C#

by Anonymous » 10 Oct 2025, 08:50 » in C#

Ich verwende C# und PowerShell, um Git-Befehle zu automatisieren und viele Repositorys zu synchronisieren. Ich habe zwei Möglichkeiten zum Ausführen von Powershell-Befehlen gefunden:...

0 Replies

36 Views

Last post by Anonymous
10 Oct 2025, 08:50
Sollte ich in C# string.Empty oder String.Empty oder „“ verwenden, um einen String zu initialisieren?

Last post by Anonymous « 20 Dec 2025, 17:24
Posted in C#

by Anonymous » 20 Dec 2025, 17:24 » in C#

In C# möchte ich einen String-Wert mit einem leeren String initialisieren.

Wie soll ich das machen?
Was ist der richtige Weg und warum?

string willi = string.Empty;

oder

string willi =...

0 Replies

11 Views

Last post by Anonymous
20 Dec 2025, 17:24
Wie deaktivieren Sie die nicht ausgewählten Optionen für ein Mehrfachauswahlelement nicht ausgewählte Optionen?

Last post by Guest « 24 Feb 2025, 04:48
Posted in HTML

by Guest » 24 Feb 2025, 04:48 » in HTML

Ich arbeite am folgenden Tags -Selektor in JavaScript, ohne ein Plugin zu verwenden. -Code >
const tagsList = document.querySelector( .tags-list )
const tagActions = document.getElementById(...

0 Replies

59 Views

Last post by Guest
24 Feb 2025, 04:48
Wie deaktivieren Sie die nicht ausgewählten Optionen für ein Mehrfachauswahlelement nicht ausgewählte Optionen?

Last post by Guest « 24 Feb 2025, 04:48
Posted in CSS

by Guest » 24 Feb 2025, 04:48 » in CSS

Ich arbeite am folgenden Tags -Selektor in JavaScript, ohne ein Plugin zu verwenden. -Code >
const tagsList = document.querySelector( .tags-list )
const tagActions = document.getElementById(...

0 Replies

56 Views

Last post by Guest
24 Feb 2025, 04:48

Return to “Python”