Policy Gradient

Doing some experiments to learn about policy gradient methods.

REINFORCE with discrete and continuous actions are implemented in discrete_actions.py and cont_actions.py.
DDPG with continuous actions is implemented in ddpg.py

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
RoboschoolHalfCheetah_v1_2017jul.py		RoboschoolHalfCheetah_v1_2017jul.py
cont_actions.py		cont_actions.py
cont_actions_actor_critic.py		cont_actions_actor_critic.py
ddpg.py		ddpg.py
discrete_actions.py		discrete_actions.py
discrete_actions_actor_critic.py		discrete_actions_actor_critic.py
utils.py		utils.py

Provide feedback