🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Python 158,356 32,597 Updated Mar 24, 2026

tile-ai / TileRT

Tile-Based Runtime for Ultra-Low-Latency LLM Inference

Python 687 40 Updated Mar 8, 2026

deepseek-ai / LPLB

An early research stage expert-parallel load balancer for MoE models based on linear programming.

Python 499 34 Updated Nov 19, 2025

BBuf / how-to-optim-algorithm-in-cuda

how to optimize some algorithm in cuda.

Cuda 2,884 264 Updated Mar 24, 2026

sgl-project / ome

Open Model Engine (OME) — Kubernetes operator for LLM serving, GPU scheduling, and model lifecycle management. Works with SGLang, vLLM, TensorRT-LLM, and Triton

Go 404 66 Updated Mar 24, 2026

xlite-dev / LeetCUDA

📚LeetCUDA: Modern CUDA Learn Notes with PyTorch for Beginners🐑, 200+ CUDA Kernels, Tensor Cores, HGEMM, FA-2 MMA.🎉

Cuda 10,008 1,001 Updated Mar 23, 2026

poloclub / transformer-explainer

Transformer Explained Visually: Learn How LLM Transformer Models Work with Interactive Visualization

JavaScript 6,992 746 Updated Mar 21, 2026

tile-ai / tilelang

Domain-specific language designed to streamline the development of high-performance GPU/CPU/Accelerators kernels

Python 5,420 485 Updated Mar 24, 2026

antgroup / sglang

Forked from sgl-project/sglang

SGLang is a fast serving framework for large language models and vision language models.

Python 30 5 Updated Mar 25, 2026

kvcache-ai / Mooncake

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++ 4,969 623 Updated Mar 25, 2026

yeahdongcn / sglang

Forked from sgl-project/sglang

SGLang is a fast serving framework for large language models and vision language models.

Python 3 Updated Mar 25, 2026

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Yu Zhou fishingfly

Achievements

Achievements

Block or report fishingfly

Stars

wireflowio / wireflow

antgroup / antoss-meetup

zhaochenyang20 / Awesome-ML-SYS-Tutorial

baidu / vLLM-Kunlun

eigent-ai / eigent

DevAgentForge / Open-Claude-Cowork

different-ai / openwork

alibaba / InferSim

alibaba / tair

reteps / dockerfmt

MooreThreads / mate

MooreThreads / mthreads-ml-py

MooreThreads / torchada

sgl-project / mini-sglang

volcano-sh / kthena

huggingface / transformers