目录
RLlib: Abstractions for Distributed Reinforcement Learning
部分参考自:https://blog.csdn.net/zkh880loLh3h21AJTH/article/details/79620311
现有的强化学习libs:
几个出发点:
https://daiwk.github.io/posts/platform-ray-tune.html
最基础用法(使用lib/python2.7/site-packages/ray/rllib/train.py
):
python ./train.py --run DQN --env CartPole-v0
python ./train.py --run APEX --env CartPole-v0
python ./train.py --run APEX_DDPG --env Pendulum-v0
python ./train.py --run DDPG --env Pendulum-v0
python ./train.py --run DDPG2 --env Pendulum-v0
python ./train.py --run A3C --env CartPole-v0
gym的所有自带的环境(注意,rllib里的ddpg适用的问题是Box的,Discrete的不能解)