MiracleLex

MiracleLex

Achievements

Wenyueh/MinivLLM Wenyueh/MinivLLM Public

Based on Nano-vLLM, a simple replication of vLLM with self-contained paged attention and flash attention implementation

Python 838 126
My-Custom-CUDA-Operator-Library My-Custom-CUDA-Operator-Library Public

收集了一些常用算子以及一个简单版本的 Flash-Attention

Cuda 1
MinivLLM MinivLLM Public

Forked from Wenyueh/MinivLLM

Based on Nano-vLLM, a simple replication of vLLM with self-contained paged attention and flash attention implementation

Python 1