Yating Wang, Haoyi Zhu, Mingyu Liu, Jiange Yang, Haoshu Fang, Tong He: VQ-VLA: Improving Vision-Language-Action Models via Scaling Vector-Quantized Action Tokenizers. CoRR abs/2507.01016 (2025)