Ich frage mich, ob es möglich ist, ein Agenten zu erstellen, der einem kontextuellen mehrkundigen Bandit verwendet wird, der die SB3-Bibliothek verwendet. /> Mein erster Ansatz war es, einen Agenten zu verwenden, indem ein Wert von gamma = 0 < /code> zugewiesen wurde, aber ich denke, das wäre mathematisch nicht korrekt. < /p>
Bearbeiten: Es ist vollkommen korrekt. Hier ist das Papier, das ich mit dieser Idee geschrieben habe: https://www.sciencedirect.com/science/a ... via%3diHub
Kann ich in SB3 einen kontextbezogenen, mehr bewaffneten Banditenagenten erstellen? ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post