gridworld

Star

Here are 65 public repositories matching this topic...

flappygolf / cheese-defender

Star

POMDP cat-and-mouse PettingZoo grid world with recurrent MARL baselines, diagnostics, and demo assets.

python reinforcement-learning gridworld pomdp multi-agent-reinforcement-learning ippo qmix mappo pettingzoo

Updated Mar 21, 2026
Python

ivanbelenky / RL

Star

R.L. methods and techniques.

reinforcement-learning qlearning q-learning markov sarsa gridworld markov-decision-processes tabular-methods

Updated Mar 16, 2026
Python

biological-alignment-benchmarks / biological-alignment-gridagents-benchmarks

Star

Safety challenges for RL and LLM agents' ability to learn and use biologically and economically aligned utility functions. The benchmarks are implemented in a gridworld-based environment. The environments are relatively simple, just as much complexity is added as is necessary to illustrate the relevant safety and performance aspects.

Updated Mar 6, 2026
Python

damat-le / gym-simplegrid

Sponsor

Star

Simple Grid Environment for Gymnasium

environment grid reinforcement-learning openai-gym openai gym rl gridworld gymnasium gym-environment gridworld-environment reinforcement-learning-environments grid-environment farama-foundation gymnasium-environment

Updated Mar 1, 2026
Python

10mudassir007 / Reinforment-Learning-Beginner-Projects

Star

reinforcement-learning cartpole rl gridworld

Updated Feb 25, 2026
Python

biological-alignment-benchmarks / ai-safety-gridworlds

Star

Extended, multi-agent, and multi-objective (MaMoRL / MoMaRL) gridworld environments building framework based on DeepMind's AI Safety Gridworlds. This is a suite of reinforcement learning environments illustrating various safety properties of intelligent agents. It is made compatible with OpenAI's Gym/Gymnasium and Farama Foundation PettingZoo.

Updated Feb 16, 2026
Python

biological-alignment-benchmarks / zoo_to_gym_multiagent_adapter

Star

Enables you to convert a PettingZoo environment to a Gym environment while supporting multiple agents (MARL). Gym's default setup doesn't easily support multi-agent environments, but this wrapper resolves that by running each agent in its own process and sharing the environment across those processes.

api adapter wrapper ai artificial-intelligence multi-agent gym rl gridworld gymnasium multi-processing multi-agent-reinforcement-learning marl pettingzoo reinforement-learning

Updated Feb 16, 2026
Python

sct202509kato / q-learning-gridworld

Star

PythonでQ学習（強化学習）を実装し、4×4グリッドでの行動学習をヒートマップで可視化したデモ。

python reinforcement-learning heatmap q-learning matplotlib gridworld

Updated Feb 5, 2026
Python

grid-universe / grid-universe

Star

A modular, extensible, entity-component-system (ECS) gridworld environment

maze entity-component-system gridworld gymnasium reinfocement-learning

Updated Jan 23, 2026
Python

jannikmi / extremitypathfinder

Sponsor

Star

python package for fast shortest path computation on 2D polygon or grid maps

Updated Jan 14, 2026
Python

govind104 / causal-airl

Star

Causal-AIRL: MSc research code + interactive demo. 23pp↑ cross-style policy agreement via latent Z deconfounding. MSc Data Science @ Edinburgh 2024-25.

data-science gridworld imitation-learning causal-inference inverse-reinforcement-learning msc-thesis airl edinburgh-university causal-ml

Updated Jan 10, 2026
Python

skunal3318 / DQN-Gridworld-Navigation

Star

A reinforcement learning project implementing a Deep Q-Network agent that learns goal oriented navigation in a custom grid environment, with policy evaluation, visualization, and analytics.

python machine-learning reinforcement-learning decision-making artificial-intelligence dqn gridworld deep-q-learning autonomous-navigation stable-baselines3 robotics-ai

Updated Dec 13, 2025
Python

alizangeneh / multiagent-warehouse-navigation-dqn

Star

Research-grade Reinforcement Learning framework for single-agent and multi-agent warehouse navigation using Deep Q-Networks (DQN), PyTorch, replay buffer, target networks, logging, and full test suite. Built for PhD-level RL and autonomous systems research.

machine-learning reinforcement-learning robotics decision-making deep-reinforcement-learning path-planning pytorch dqn multiagent-systems gridworld deep-q-network ai-research target-network autonomous-navigation experience-replay multi-agent-rl cooperative-agents multi-agent-navigation warehouse-robotics

Updated Dec 11, 2025
Python

captv89 / autonomous-vessel-navigation

Star

Simulating the autonomous ship navigation in a gridworld.

pathfinding collision-detection autonomous gridworld autonomous-driving collision-avoidance maritime path-following ilos maritime-safety nomoto colregs

Updated Dec 3, 2025
Python

artzylabs / store-rl-agent

Star

python reinforcement-learning decision-making q-learning gridworld neuroeconomics

Updated Nov 20, 2025
Python

7riangle / sc2-alpha-rtd

Star

Experimental AlphaZero-style RL agent for optimizing strategies in the StarCraft II Arcade map 'New Random Tower Defense'.

python reinforcement-learning simulation deep-reinforcement-learning pytorch tower-defense mcts gridworld strategy-game game-ai starcraft2 grid-based-game

Updated Nov 19, 2025
Python

msmrexe / python-mdp-solver

Star

An implementation of Value Iteration and Policy Iteration to solve a stochastic, grid-based Markov Decision Process (MDP), using the Gridworld environment.

python university-project artificial-intelligence course-project gridworld markov-decision-processes policy-iteration value-iteration