sharkwyf

Yuanfu Wang sharkwyf

First to the key

Achievements

adversarial-preference-learning adversarial-preference-learning Public

[ACL'2025 Findings] Adversarial Preference Learning for Robust LLM Alignment

1
critic-guided-decision-transformer critic-guided-decision-transformer Public

[AAAI'2024] Critic-Guided Decision Transformer for Offline Reinforcement Learning

Python 18
native-reasoning-models native-reasoning-models Public

[ICLR '2026] Native Reasoning Models: Training Language Models to Reason on Unverifiable Data

Python 3