Stars
6
stars
written in C++
Clear filter
2023春季学期 北京邮电大学 编译原理与技术课程设计 Pascal-S到C语言编译器
micropuma / fastllm
Forked from ztxz16/fastllmfastllm是c++实现,后端无依赖(仅依赖CUDA,无需依赖PyTorch)的高性能大模型推理库。 可实现单4090推理DeepSeek R1 671B INT4模型,单路可达20+tps。