[🚀 ICLR 2026 Oral] NextStep-1: SOTA Autogressive Image Generation with Continuous Tokens. A research project developed by the StepFun’s Multimodal Intelligence team.

Python 684 25 Updated Feb 27, 2026

facebookresearch / dinov3

Reference PyTorch implementation and models for DINOv3

Jupyter Notebook 10,419 842 Updated Mar 30, 2026

TencentARC / TokLIP

TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation

Python 236 6 Updated Aug 18, 2025

guandeh17 / Self-Forcing

Official codebase for "Self Forcing: Bridging Training and Inference in Autoregressive Video Diffusion" (NeurIPS 2025 Spotlight)

Python 3,347 265 Updated Sep 12, 2025

MinghanLi / FiVE-Bench

[ICCV 2025] FiVE-Bench: A Fine-grained Video Editing Benchmark for Evaluating Emerging Diffusion and Rectified Flow Models

Python 37 Updated Apr 2, 2026

yukangcao / Awesome-4D-Spatial-Intelligence

A curated list of awesome papers for reconstructing 4D spatial intelligence from video. (arXiv 2507.21045)

490 25 Updated May 4, 2026

Wan-Video / Wan2.2

Wan: Open and Advanced Large-Scale Video Generative Models

Python 15,798 1,946 Updated Mar 17, 2026

facebookresearch / vggt

[CVPR 2025 Best Paper Award] VGGT: Visual Geometry Grounded Transformer

Python 13,128 1,462 Updated May 16, 2026

wzzheng / StreamVGGT

[ICLR 2026] Streaming 4D Visual Geometry Transformer

Python 912 46 Updated Oct 27, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Xianfeng Wu XianfengWu01

Achievements

Achievements

Block or report XianfengWu01

Stars

lillian039 / ELF

Ugness / ELF-pytorch

OpenSenseNova / SenseNova-U1

inclusionAI / LLaDA2.0-Uni

MinghanLi / Visual_Intelligence_Job_Talk_Mines

GAIR-NLP / daVinci-MagiHuman

EnVision-Research / DVD

dreamzero0 / dreamzero

AI4Science-WestlakeU / scDFM

WenjieShu / LoopViT

EnVision-Research / LatentMorph

xgen-universe / Capybara

CoronRing / FilmRing

AI4Science-WestlakeU / RealPDEBench

LAW1223 / OpenSubject

hustvl / 4DLangVGGT

EnVision-Research / TiViBench

AI4Science-WestlakeU / BuildArena

EnVision-Research / ScalingAR

Neur-IO / ReVQ

XianfengWu01 / LightGen

stepfun-ai / NextStep-1