random-nlp-things

Pytorch Lightning implementation for various NLP tasks

Code

This repository contains:

Finetuning Transformer decoder (Llama/Komodo/Qwen) for Indonesian Regional Language Translations, modes: Vanilla finetuning, Low Rank Adaptation (LoRA) via peft, Fully Sharded Data Parallel (FSDP) with Pytorch XLA.
Additional pretraining script for Transformer encoder (XLM Roberta) with Masked Language Modelling Objective.
Finetuning Transformer encoder (XLM Roberta) for zero shot classification.
Finetuning Transformer encoder (XLM Roberta) for sentiment analysis.

Name		Name	Last commit message	Last commit date
Latest commit History 105 Commits
pretrain-xlmr		pretrain-xlmr
sentiment		sentiment
translation		translation
zero-shot		zero-shot
README.md		README.md
tes.py		tes.py