wenzhaojie

Follow

wenzhaojie

Follow

1 follower · 2 following

Stars

2 results for source starred repositories written in C++

ggml-org / llama.cpp

LLM inference in C/C++

C++ 89,236 13,583 Updated Nov 6, 2025

ztxz16 / fastllm

fastllm是后端无依赖的高性能大模型推理库。同时支持张量并行推理稠密模型和混合模式推理MOE模型，任意10G以上显卡即可推理满血DeepSeek。双路9004/9005服务器+单显卡部署DeepSeek满血满精度原版模型，单并发20tps；INT4量化模型单并发30tps，多并发可达60+。

C++ 4,066 412 Updated Oct 28, 2025