
Das sieht erstens seltsam aus, ist nicht so in der Gymnasium-Robotics-Dokumentation oder anderen Beispiellösungen für dieses Problem, und ich denke, es bringt das Problem so durcheinander, wie ich bin Ich bin mir nicht einmal sicher, ob der Arm überhaupt dazu in der Lage ist um einige der Zielpositionen wie folgt zu erreichen.
Das Ausführen dieses Codes zeigt das auftretende Problem (zumindest für mich):
Code: Select all
import gymnasium as gym
import gymnasium_robotics
import numpy as np
# Creating environment
gym.register_envs(gymnasium_robotics)
env = gym.make("FetchReachDense-v3", render_mode="human")
observation, info = env.reset(seed=42)
print("Simulating with completely random actions")
# loop
summed_reward = 0
for _ in range(2000):
action = np.random.uniform(-1, 1,4) # random action
observation, reward, terminated, truncated, info = env.step(action) # Calculate next step of simulation.
summed_reward += reward # sum rewards
if terminated or truncated:
print("summed reward =", summed_reward)
summed_reward = 0
observation, info = env.reset()
env.close()
Ich betreibe Python==3.11 mit gymnasium==1.0.0, gymnasium-robotics=1.3.1, mujoco==3.2.7 und numpy ==2.2.1. Das Problem trat auch bei numpy=2.1.3 und bei einer älteren Version mujoco auf (ich bin mir nicht mehr sicher über die genaue Version).
Haben Sie Ideen, was ich hier falsch mache? Oder ist das tatsächlich ein Problem mit Turnhallen-Robotik?
Vielen Dank im Voraus und wenn Sie weitere Informationen benötigen, lassen Sie es mich wissen.