diffusion-transformer

Here are 47 public repositories matching this topic...

yurekami / derf

Derf (Dynamic erf) - Normalization-Free Transformer Activation. Reimplementation of arXiv:2512.10938

machine-learning deep-learning pytorch transformer gpt normalization dna-sequence wav2vec vision-transformer diffusion-transformer

Updated Dec 13, 2025
Python

zihaowu25 / InvarDiff

Star

InvarDiff: Cross-Scale Invariance Caching for Accelerated Diffusion Models

flux diffusion dit efficient-inference diffusion-models efficient-machine-learning diffusion-transformer

Updated Dec 10, 2025
Python

thu-ml / DiT-Extrapolation

Star

Official implementation for "RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers" (ICML 2025) and "UltraViCo: Breaking Extrapolation Limits in Video Diffusion Transformers"

generative-model rope diffusion extrapolation dit video-generation position-embedding diffusion-models long-video-generation diffusion-transformer cogvideox hunyuan-video

Updated Dec 4, 2025
Python

TencentARC / GenCompositor

Star

Official implementation of the paper "GenCompositor: Generative Video Compositing with Diffusion Transformer"

video-editing diffusion-models diffusion-transformer

Updated Nov 24, 2025
Python

Tencent-Hunyuan / HunyuanVideo

Star

HunyuanVideo: A Systematic Framework For Large Video Generation Model

video-generation diffusion-models diffusion-transformer

Updated Nov 21, 2025
Python

River-Zhang / ICEdit

Star

[NeurIPS 2025] Image editing is worth a single LoRA! 0.1% training data for fantastic image editing! Surpasses GPT-4o in ID persistence~ MoE ckpt released! Only 4GB VRAM is enough to run!

image-editing diffusion dit diffusion-models in-context editing-image diffusion-transformer gpt4o gpt4oimage

Updated Nov 12, 2025
Python

thu-ml / SLA

Star

SLA: Beyond Sparsity in Diffusion Transformers via Fine-Tunable Sparse–Linear Attention

transformer video-generation mlsys inference-acceleration ai-infra linear-attention sparse-attention diffusion-transformer train-acceleration sparse-linear-attention

Updated Nov 12, 2025
Python

Pur1zumu / RIFT-SVC

Star

Implementation of RIFT-SVC, a singing voice conversion model based on Rectified Flow Transformer.

svc svc-model singing-voice-conversion rectified-flow ai-voice-clone diffusion-transformer

Updated Nov 10, 2025
Python

ML-GSAI / Scaling-Diffusion-Transformers-muP

Star

[NeurIPS 2025] Official implementation for our paper "Scaling Diffusion Transformers Efficiently via μP".

image-generation scaling hyperparameter-tuning mup diffusion-models diffusion-transformer

Updated Nov 2, 2025
Python

mlpc-ucsd / Lay-Your-Scene

Star

(ICCV 2025) 🎨 Lay-Your-Scene: Natural Scene Layout Generation with Diffusion Transformers

scene-generation diffusion-transformer

Updated Oct 26, 2025
Python

Shopee-MUG / MUG-V-Megatron-LM-Training

Star

Official training code for MUG-V 10B video generation model. Built on Megatron-LM (v0.14.0) with production-ready distributed training for 10B DiT.

dit video-generation megatron-lm diffusion-transformer megatron-core

Updated Oct 20, 2025
Python

K1nght / Unified-Unlearning-w-Remain-Geometry

Star

[NeurIPS2024 (Spotlight)] "Unified Gradient-Based Machine Unlearning with Remain Geometry Enhancement" by Zhehao Huang, Xinwen Cheng, JingHao Zheng, Haoran Wang, Zhengbao He, Tao Li, Xiaolin Huang

machine-unlearning diffusion-model steepest-descent stable-diffusion diffusion-transformer