OpenLipSync

Experimental work-in-progress project

An open-source, cross-platform project that converts audio input into realistic facial expressions in real-time following the MPEG-4 (FBA) standard.

Setup for model training

Core (uv)

uv sync

MFA (micromamba)

micromamba create -n mfa -c conda-forge python=3.12 montreal-forced-aligner
micromamba activate mfa

mfa model download acoustic english_us_arpa
mfa model download dictionary english_us_arpa
mfa model download g2p english_us_arpa

Dataset Download is now integrated in the training script.

python training/train.py --config training/recipes/tcn_config.toml

This project uses the LibriSpeech ASR corpus (CC BY 4.0 license).

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
inference/OpenLipSync.Inference		inference/OpenLipSync.Inference
training		training
.gitignore		.gitignore
.python-version		.python-version
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
run_mfa_alignment_prepared.sh		run_mfa_alignment_prepared.sh
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

OpenLipSync

Setup for model training

About

Uh oh!

Releases 2

Packages

Languages

License

KyuubiYoru/OpenLipSync

Folders and files

Latest commit

History

Repository files navigation

OpenLipSync

Setup for model training

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages