Build software better, together

thu-ml / tianshou

An elegant PyTorch deep reinforcement learning library.

pytorch dqn policy-gradient rl cql atari ddpg imitation-learning sac drl npg double-dqn trpo mujoco ppo a2c td3 bcq transferlab

Updated Apr 3, 2026
Python

sweetice / Deep-reinforcement-learning-with-pytorch

Star

PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....

algorithm deep-learning deep-reinforcement-learning pytorch dqn policy-gradient sarsa resnet a3c reinforce sac alphago actor-critic trpo ppo a2c actor-critic-algorithm td3

Updated Mar 24, 2023
Python

Khrylx / PyTorch-RL

Star

PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

reinforcement-learning deep-reinforcement-learning pytorch generative-adversarial-network policy-gradient trpo fisher-vectors pytorch-rl proximal-policy-optimization ppo a2c

Updated Feb 9, 2021
Python

MushroomRL / mushroom-rl

Star

Python library for Reinforcement Learning.

reinforcement-learning qlearning deep-learning deep-reinforcement-learning openai-gym pytorch dqn rl atari ddpg sac trpo mujoco pybullet

Updated Aug 4, 2025
Python

sudharsan13296 / Hands-On-Reinforcement-Learning-With-Python

Star

Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow

Updated Oct 7, 2020
Jupyter Notebook

jingweiz / pytorch-rl

Star

Deep Reinforcement Learning with pytorch & visdom

reinforcement-learning deep-learning deep-reinforcement-learning pytorch dqn a3c actor-critic pytorch-a3c acer trpo visdom

Updated Jul 16, 2020
Python

TianhongDai / reinforcement-learning-algorithms

Star

This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are still in progress)

algorithm deep-learning atari2600 flappy-bird deep-reinforcement-learning pytorch dqn ddpg sac actor-critic trpo dueling-dqn trust-region-policy-optimization proximal-policy-optimization ppo a2c soft-actor-critic

Updated Dec 18, 2025
Python

archsyscall / DeepRL-TensorFlow2

Star

🐋 Simple implementations of various popular Deep Reinforcement Learning algorithms using TensorFlow2

machine-learning reinforcement-learning deep-learning tensorflow deep-reinforcement-learning dqn a3c reinforce ddpg sac double-dqn trpo dueling-dqn ppo a2c rainbow-dqn tensorflow2

Updated Jun 4, 2022
Python

dongminlee94 / deep_rl

Star

PyTorch implementation of deep reinforcement learning algorithms

deep-reinforcement-learning pytorch dqn ddpg sac npg ddqn trpo ppo a2c td3 model-free-rl vpg sac-aea

Updated Nov 19, 2021
Python

sudharsan13296 / Deep-Reinforcement-Learning-With-Python

Star

Master classic RL, deep RL, distributional RL, inverse RL, and more using OpenAI Gym and TensorFlow with extensive Math

reinforcement-learning deep-learning deep-reinforcement-learning openai-gym q-learning dqn policy-gradient a3c ddpg sac inverse-reinforcement-learning actor-critic bellman-equation double-dqn trpo c51 ppo a2c td3

Updated Apr 1, 2021
Jupyter Notebook

ikostrikov / pytorch-trpo

Star

PyTorch implementation of Trust Region Policy Optimization

reinforcement-learning deep-learning deep-reinforcement-learning pytorch continuous-control trpo mujoco trust-region-policy-optimization

Updated Sep 13, 2018
Python

Skylark0924 / Machine-Learning-is-ALL-You-Need

Star

🔥🌟《Machine Learning 格物志》: ML + DL + RL basic codes and notes by sklearn, PyTorch, TensorFlow, Keras & the most important, from scratch!💪 This repository is ALL You Need!

Updated Aug 25, 2023
Python

RITCHIEHuang / DeepRL_Algorithms

Star

DeepRL algorithms implementation easy for understanding and reading with Pytorch and Tensorflow 2(DQN, REINFORCE, VPG, A2C, TRPO, PPO, DDPG, TD3, SAC)

deep-reinforcement-learning dqn policy-gradient reinforcement-learning-algorithms reinforcement trpo mujoco pytorch-rl ppo td3 pytorch-implementation soft-actor-critic tensorflow2 policygradient

Updated Mar 25, 2023
Python

liuzuxin / FSRL

Star

🚀 A fast safe reinforcement learning library in PyTorch

library reinforcement-learning robotics decision-making pytorch sac safety-critical trpo ppo cpo safe-rl trustworthy-ai cvpo

Updated Sep 30, 2024
Python

RchalYang / torchrl

Star

Pytorch Implementation of Reinforcement Learning Algorithms ( Soft Actor Critic(SAC)/ DDPG / TD3 /DQN / A2C/ PPO / TRPO)

algorithm reinforcement-learning pytorch dqn gym ddpg sac trpo mujoco ppo td3 rl-algorithms policy-agent

Updated Jul 10, 2022
Python

AcutronicRobotics / ros2learn

Star

ROS 2 enabled Machine Learning algorithms

machine-learning reinforcement-learning deep-learning robotics ml ros dqn rl ros2 trpo ppo acktr

Updated Jun 26, 2019
Python

andrewliao11 / gail-tf

Star

Tensorflow implementation of generative adversarial imitation learning

reinforcement-learning tensorflow generative-adversarial-network imitation-learning inverse-reinforcement-learning continuous-control trpo gail

Updated Apr 23, 2018
Python

steveKapturowski / tensorflow-rl

Star

Implementations of deep RL papers and random experimentation

reinforcement-learning tensorflow openai-gym dqn a3c pgq trpo

Updated Apr 7, 2018
Python

LxzGordon / Deep-Reinforcement-Learning-with-pytorch

Star

Basic reinforcement learning algorithms. Including:DQN,Double DQN, Dueling DQN, SARSA, REINFORCE, baseline-REINFORCE, Actor-Critic,DDPG,DDPG for discrete action space, A2C, A3C, TD3, SAC, TRPO

algorithm reinforcement-learning pytorch dqn sarsa a3c ddpg sac actor-critic double-dqn trpo dueling-dqn a2c td3 policy-gradients

Updated Mar 1, 2021
Python

NJUxlj / Chinese-MedQA-Qwen2

Star

基于Qwen2+SFT+DPO的医疗问答系统，项目中使用了自定义的 SFTTrainer/DPOTrainer/TRPOTrainer用于训练，其次，项目还调用各种知识库工具（neo4j, milvus, LDA, 等）进行自动化训练数据生成。另外，使用 vllm 用于推理和部署训好的模型, 该模型会通过 vllm API 来接入一个基于 embedder + Reranker 的 RAG 系统。另外还参考 MDAgents 论文实现了一个多智能体会诊系统，同样也支持 vllm api 接入。

mas trpo rag dpo vllm qwen2

Updated Apr 29, 2026
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

trpo

Here are 81 public repositories matching this topic...

thu-ml / tianshou

sweetice / Deep-reinforcement-learning-with-pytorch

Khrylx / PyTorch-RL

MushroomRL / mushroom-rl

sudharsan13296 / Hands-On-Reinforcement-Learning-With-Python

jingweiz / pytorch-rl

TianhongDai / reinforcement-learning-algorithms

archsyscall / DeepRL-TensorFlow2

dongminlee94 / deep_rl

sudharsan13296 / Deep-Reinforcement-Learning-With-Python

ikostrikov / pytorch-trpo

Skylark0924 / Machine-Learning-is-ALL-You-Need

RITCHIEHuang / DeepRL_Algorithms

liuzuxin / FSRL

RchalYang / torchrl

AcutronicRobotics / ros2learn

andrewliao11 / gail-tf

steveKapturowski / tensorflow-rl

LxzGordon / Deep-Reinforcement-Learning-with-pytorch

NJUxlj / Chinese-MedQA-Qwen2

Improve this page

Add this topic to your repo