llama3

Here are 16 public repositories matching this topic...

jawad-zaheer123 / Nano-RAG-CPP

🚀 Build high-performance AI applications with this C++ engine for Retrieval Augmented Generation (RAG) and efficient memory management.

nlp agent docker lightweight distributed-systems automation browser deep-learning cpp comet nano dia mariner manus llama3

Updated Mar 27, 2026
C++

Mikaaz / AI-roadmap

Star

data-science roadmap tutorial deep-learning numpy chatbot mathematics pandas aiml aws-polly study-plan machine-learning-from-scratch claude aws-lex artifical-intelligense langchain langgraph llama3

Updated Mar 27, 2026
C++

luckystar-pear / llm-compress

Star

Compress context data to optimize memory and performance in C++ large language model applications within the llm-cpp toolkit.

nlp cli lightweight sparsity tool evaluation developer-tools pruning wan awq llm fastertransformer smoothquant token-reduction codellama internlm2 token-merging llama3 deepseek-v3

Updated Mar 27, 2026
C++

AXERA-TECH / ax-llm

Star

Explore LLM model deployment based on AXera's AI chips

transformer vlm edge-computing huggingface llm minicpm qwen2 axera llama3 minicpm-v gemma2 internvl2

Updated Mar 27, 2026
C++

sophgo / LLM-TPU

Star

Run generative AI models in sophgo BM1684X/BM1688

large-language-models llm generative-ai llm-inference bm1684x llama3 qwen3 qwen2-5-vl bm1688 internvl3 qwen3-vl

Updated Mar 26, 2026
C++

r3tr056 / loc-ai-ly

Star

Locaily - Making Large Language Model Inference Accessible on Consumer Hardware

cuda inference llm llamacpp deepseek llama3

Updated Mar 22, 2026
C++

b4rtaz / distributed-llama

Sponsor

Star

Distributed LLM inference. Connect home devices into a powerful cluster to accelerate LLM inference. More devices means faster inference.

neural-network distributed-computing llm llms open-llm llm-inference llama2 distributed-llm llama3

Updated Feb 10, 2026
C++

Pinkisingh13 / rockpaperscissor

Star

A full-stack Rock Paper Scissors game where you play against an AI powered by Groq's Llama 3.1 model. Built with Flutter (frontend) and FastAPI (backend). Give it a star🌟

ai render python3 netlify rock-paper-scissors flutter fastapi groq ai-game-development llm llama3

Updated Feb 7, 2026
C++

KolosalAI / kolosal-server

Sponsor

Star

Kolosal AI is an OpenSource and Lightweight alternative to Ollama to run LLMs 100% offline on your device.

c cpp llama gemma mistral llm llms llava llama2 ollama qwen deepseek llama3 phi4 gemma3 gemma3n

Updated Jan 2, 2026
C++

hitesh-bhatnagar / Nano-RAG-CPP

Star

A high performance, containerized Local LLM Inference Engine build in C++. Features a custom RAG system, Agentic File I/O tools, and Docker deployment.

linux agent docker cpp artificial-intelligence machi rag llm llamacpp llama3