To Top
首页 > 常用平台 > 正文

ray-rllib

标签:ray, rllib


目录

简介

RLlib: Abstractions for Distributed Reinforcement Learning

部分参考自:https://blog.csdn.net/zkh880loLh3h21AJTH/article/details/79620311

现有的强化学习libs:



几个出发点:

  • 需要支持现有的机器学习库。因为RL通常使用基于梯度下降或进化算法来学习和拟合策略函数,所以您需要它支持您最喜欢的库(TensorFlow,Keras,PyTorch等)。
  • 可扩展性。RL是计算密集型的,并且在关键应用程序中开始使用RL时,可以选择以分布式方式运行。
  • 可组合性。RL算法通常涉及模拟和许多其他组件。 您将需要一个库,允许您重用与多种深度学习框架兼容的RL算法组件(例如策略图,走子演算[这是啥。。]等),并提供可组合的分布式执行原语(嵌套并行)

tune

https://daiwk.github.io/posts/platform-ray-tune.html

使用

最基础用法(使用lib/python2.7/site-packages/ray/rllib/train.py):

python ./train.py --run DQN --env CartPole-v0 
python ./train.py --run APEX --env CartPole-v0
python ./train.py --run APEX_DDPG --env Pendulum-v0
python ./train.py --run DDPG --env Pendulum-v0
python ./train.py --run DDPG2 --env Pendulum-v0
python ./train.py --run A3C --env CartPole-v0 




gym自带的环境

gym的所有自带的环境(注意,rllib里的ddpg适用的问题是Box的,Discrete的不能解)

https://github.com/openai/gym/wiki/Table-of-environments


原创文章,转载请注明出处!
本文链接:http://daiwk.github.io/posts/platform-ray-rllib.html
上篇: bazel
下篇: ray-tune

comment here..