TUNA

Supported Features

Fine-tuning LM (chatbot)
Pre-training LM

Setup

TPU

# install torch, torch_xla
pip install torch~=2.2.0 torch_xla[tpu]~=2.2.0 -f https://storage.googleapis.com/libtpu-releases/index.html

# or use docker
sudo docker run -it --name tuna \
    -d --privileged \
    --net host \
    --shm-size=16G \
    -e VM_NAME="TPUv4-A" \
    -v $HOME:/workspace \
    -v /data/hf-home:/root/.cache/huggingface/ \
    -v /data/checkpoint:/data/checkpoint/ \
    us-central1-docker.pkg.dev/tpu-pytorch-releases/docker/xla:r2.5.0_3.10_tpuvm \
    /bin/bash

# us-central1-docker.pkg.dev/tpu-pytorch-releases/docker/xla:r2.2.0_3.10_tpuvm
# us-central1-docker.pkg.dev/tpu-pytorch-releases/docker/xla:r2.1.0_3.10_tpuvm
# us-central1-docker.pkg.dev/tpu-pytorch-releases/docker/xla:r2.5.0_3.10_tpuvm

If you see a error like a below while using conda:

RuntimeError: Failed to import transformers.training_args because of the following error (look up to see its traceback): 
libpython3.11.so.1.0: cannot open shared object file: No such file or director```

export USE_TORCH=True export LD_LIBRARY_PATH=$HOME/miniconda/lib/

or

export LD_LIBRARY_PATH=$HOME/miniconda/envs/?/lib export LD_LIBRARY_PATH=$HOME/miniconda/envs/qax/lib:$LD_LIBRARY_PATH


</div>
</details>

pip install -r requirements.txt



# Discord Bot

python -m tuna.serve.flax_discord Qwen/Qwen2-7B-Instruct


## Evaluation

### Generations

python -m eval.nlgbench_gen MODEL_NAME --batch_size 4 --use_vllm --dataset ifeval,alpaca-eval,mt-bench,logickor


### Evaluation
```bash
# Logickor
python eval.judge_logickor -o outputs/heegyu/0713-qwen2-magpie-qarv@lr2e-5-epoch-1/logickor.json

# alpacaeval
alpaca_eval --model_outputs "outputs/$model_name/alpaca-eval.json" --annotators_config chatgpt

# ifeval
python -m eval.instruction_following_eval.evaluation_main \
    --input_response_data=outputs/$model/ifeval.json

# mt-bench

VLLM for TPU

# from repository build
git clone https://github.com/vllm-project/vllm.git
docker build -f Dockerfile.tpu -t vllm-tpu .

# from docker hub
sudo docker run -it --name vllm \
    -d --privileged \
    --net host \
    --shm-size=16G \
    -e VM_NAME="TPUv4-A" \
    -v $HOME:/workspace \
    -v /data/hf-home:/root/.cache/huggingface/ \
    -v /data/checkpoint:/data/checkpoint/ \
    heegyu/vllm-tpu \
    /bin/bash

# from source (in TPU docker)
git clone https://github.com/vllm-project/vllm.git
cd vllm
pip install torch_xla[pallas] -f https://storage.googleapis.com/jax-releases/jax_nightly_releases.html -f https://storage.googleapis.com/jax-releases/jaxlib_nightly_releases.html
pip install -r requirements-tpu.txt
pip install setuptools-scm
VLLM_TARGET_DEVICE="tpu" python setup.py develop
cd ../

python test_vllm.py

Name		Name	Last commit message	Last commit date
Latest commit History 237 Commits
eval		eval
fastchat		fastchat
flax-script		flax-script
image		image
notebook		notebook
script		script
test		test
tuna		tuna
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
check_data.py		check_data.py
example.py		example.py
gradio_demo.py		gradio_demo.py
magpie_filter.py		magpie_filter.py
requirements.txt		requirements.txt
test_vllm.py		test_vllm.py
tpu_flax_setup.sh		tpu_flax_setup.sh
tpu_requirements.txt		tpu_requirements.txt
tpu_torch_setup.sh		tpu_torch_setup.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

TUNA

Supported Features

Setup

or

VLLM for TPU

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

License

HeegyuKim/tuna

Folders and files

Latest commit

History

Repository files navigation

TUNA

Supported Features

Setup

or

VLLM for TPU

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages