Skip to content

Pseudo-Lab/Re-lax

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

🚀 Re&lax - RL 을 다시 위대하게!

PseudoLab Discord Community Stars Badge Forks Badge Pull Requests Badge Issues Badge GitHub contributors

Re(inforcement learning) & lax(jax 기본 연산)
이 프로젝트 “Re&lax - RL 을 다시 위대하게!” 는 공갈빵 같던 RL 을 실속 있게 만드는걸 목표로 합니다.

🌟 프로젝트 목표 (Project Vision)

"RL의 샘플 효율성과 연산 효율성, 두 마리 토끼를 잡는 JAX 기반 실험실"

🎯 무엇을 연구하나요? (What we do)

느리고 비효율적인 강화학습(RL)의 한계를 JAX를 통해 극복합니다. 본 프로젝트는 RL의 2대 핵심 병목인 샘플 효율성연산 효율성 문제를 정면으로 다룹니다.

  • 샘플 효율성 개선: 최신 논문(Dreamer, BBF, TD-MPC2 등)을 리뷰하고 JAX로 직접 구현하여, 더 적은 데이터로 빠르게 학습하는 RL을 검증합니다.
  • 연산 효율성 극대화: JAX의 JIT 컴파일, 병렬 처리(vmap, pmap) 등 가속 기능을 활용해 PyTorch 등 기존 프레임워크의 오버헤드를 제거하고 GPU 연산 효율을 100%에 가깝게 끌어올립니다.

📝 주요 활동 및 결과물 (Activities & Deliverables)

16주 동안 논문 리뷰 → JAX 구현 → 벤치마크 의 워크플로우로 아래 결과물을 만듭니다.

  • 핵심 결과물: JAX 기반 샘플 효율적 RL 알고리즘 오픈소스 구현체
  • 산출물:
    • 리뷰 논문 요약 및 구현 코드 공유
    • JAX-RL 구현 경험을 담은 튜토리얼

🧑 역동적인 팀 소개 (Dynamic Team)

역할 이름 소개 Github
Builder 정규석 RL 을 짝사랑하는 사람입니다. tinker495
Runner 강동화 RL을 업무에 활용하려고 하는 사람입니다. dhkang8828
Runner 진승정

🚀 프로젝트 로드맵 (Project Roadmap)

gantt
    title Re-lax 프로젝트 여정 (16주)
    dateFormat  YYYY-MM-DD
    section 핵심 마일스톤
    논문 리뷰 및 선정 :a1, 2025-09-08, 21d
    선정 논문 JAX 구현 :a2, after a1, 70d
    결과 정리 및 공유 :a3, after a2, 14d
Loading

💻 주차별 활동 (Activity History)

진행 및 발표

  • 첫 주차는 빌더의 OT 및 세미나가 진행됩니다.
  • 첫 주차 이후 2주차 전까지 리뷰할 논문을 논의하고 선정합니다.
  • 각각 논문을 최소 1개, 가능하면 2개 리뷰 합니다.
    • 구현 난이도나 이해도 측면에서 어떤 논문을 구현할지 고민 된다면 2개를 리뷰하고 참석자들이 함께 고민해주는 시간을 가집시다!
  • 모든 리뷰 이후 각각 1인 1논문을 잡아 구현을 시작하고 매주 서로 진행 사항을 공유합니다.
    • 목표하는 구현의 난이도가 극악 이라고 모두 공감하거나, 구현하고 싶은 논문이 동일하면 협업을 해도 좋다고 생각합니다.
주차 담당자 주제/분량 발표/실험/리뷰 내용 결과물 유형
1주차 정규석 Why RL is not Efficient? OT 진행, 공동 git 생성 발표자료
2주차 A, B 논문 A
논문 B
논문 PPT 발표 발표자료
9/22 N/A Magical Week 휴식!
... ...
N주차 전부 구현할 논문 분배 구현 git 레포 생성 git
N+1 전부 구현 진척 사항 공유 구현 git 레포 갱신 git
10/27 N/A Magical Week 휴식!
... ...
16주 전부 마무리! git

Acknowledgement 🙏

이 프로젝트는 가짜연구소 Open Academy로 진행됩니다. 여러분의 참여와 기여가 ‘우연한 혁명(Serendipity Revolution)’을 가능하게 합니다. 모두에게 깊은 감사를 전합니다. This project is developed as part of Pseudo-Lab's Open Research Initiative. Special thanks to our contributors and the open source community for their valuable insights and contributions.

About Pseudo Lab 👋🏼

Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.

Contributors 😃



License 🗞

This project is licensed under the MIT License.

About

Re&lax - RL을 다시 위대하게! 의 프로젝트 진행을 위한 레포입니다.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •