ray-rllib

首页 > 常用平台 > 正文

标签：ray, rllib

2018-06-05

简介
tune
使用
- gym自带的环境

简介

RLlib: Abstractions for Distributed Reinforcement Learning

部分参考自：https://blog.csdn.net/zkh880loLh3h21AJTH/article/details/79620311

现有的强化学习libs：

几个出发点：

需要支持现有的机器学习库。因为RL通常使用基于梯度下降或进化算法来学习和拟合策略函数，所以您需要它支持您最喜欢的库（TensorFlow，Keras，PyTorch等）。
可扩展性。RL是计算密集型的，并且在关键应用程序中开始使用RL时，可以选择以分布式方式运行。
可组合性。RL算法通常涉及模拟和许多其他组件。您将需要一个库，允许您重用与多种深度学习框架兼容的RL算法组件（例如策略图，走子演算[这是啥。。]等），并提供可组合的分布式执行原语（嵌套并行）。

tune

https://daiwk.github.io/posts/platform-ray-tune.html

使用

最基础用法(使用lib/python2.7/site-packages/ray/rllib/train.py)：

python ./train.py --run DQN --env CartPole-v0 
python ./train.py --run APEX --env CartPole-v0
python ./train.py --run APEX_DDPG --env Pendulum-v0
python ./train.py --run DDPG --env Pendulum-v0
python ./train.py --run DDPG2 --env Pendulum-v0
python ./train.py --run A3C --env CartPole-v0 

gym自带的环境

gym的所有自带的环境（注意，rllib里的ddpg适用的问题是Box的，Discrete的不能解）

https://github.com/openai/gym/wiki/Table-of-environments

原创文章，转载请注明出处！
本文链接：http://daiwk.github.io/posts/platform-ray-rllib.html

上篇： bazel

下篇： ray-tune

comment here..

ray-rllib

简介

tune

使用

gym自带的环境

栏目分类

最新文章