강화학습을 위한 커스텀 Gymnasium 환경 모음. Stable Baselines3 호환.
- GridWorld — 5x5 그리드에서 타겟을 찾아가는 기본 환경
- BattleSsafy — 배틀시티 기반 환경 (개발 중, 현재 GridWorld 복제 상태)
- Gymnasium + Stable Baselines3 (A2C, PPO)
- pygame (렌더링)
- pytest + pytest-benchmark (테스트/벤치마크)
- TensorBoard (학습 시각화)
gymnasium_env/envs/ # 커스텀 환경 구현
training/ # 학습 코드 + 하이퍼파라미터 설정
tests/ # 단위/통합/벤치마크 테스트
tests/simulation/ # 학습된/랜덤 정책 시뮬레이션 스크립트
pip install -e ".[dev]"python training/grid_world/train.py
# 모델: ./models/a2c_gridworld.zip, 로그: ./logs/
tensorboard --logdir ./logs/# 단위 + 통합
pytest tests/unit tests/integration
# 벤치마크
pytest tests/benchmarks --benchmark-only# 랜덤 정책
python tests/simulation/grid_world/random_simulation.py
# 학습된 모델 (models/ 아래에 저장된 zip 필요)
python tests/simulation/grid_world/learned_simulation.py- battle_city_deep_learning — 배틀시티 강화학습