quantization

Here are 43 public repositories matching this topic...

OpenNMT / CTranslate2

Fast inference engine for Transformer models

Updated Nov 7, 2025
C++

indie / qmec

A quantum puzzle and adventure into Native Language decolonization; features an introduction to the master quantum plane and the truthful history of indigenous peoples. Not G-rated.

quantum-mechanics feed quantization quantum-information forests decolonization ethnobotany turtleisland

Updated Nov 4, 2025
C++

CoffeeVampir3 / Hyper-AMX

Star

Repo for AMX + FAST

inference amx tensor quantization avx512 inference-engine matmul numa-aware tensor-parallelism

Updated Nov 1, 2025
C++

TarunNagarajan / TinyQuant

Star

A tool that performs layer-wise quantization of LLM models to optimize the quality-to-size tradeoff beyond uniform quantization methods. Built on top of 'llama.cpp'.

hardware policy quantization neural

Updated Oct 24, 2025
C++

VectorDB-NTU / RaBitQ-Library

Star

A lightweight library for the RaBitQ algorithm and its applications in vector search.

nearest-neighbor-search quantization vector-search vector-database

Updated Oct 13, 2025
C++

GoudAbhinav / EQ_Torch

Star

Support fixed posit quantised training, inference and fine tuning of neural networks (pytorch based) using the highly optimised fp multiplication on GPU

cuda quantization quantization-aware-training

Updated Oct 12, 2025
C++

autohdw / QuBLAS

Star

Quantized BLAS

template cpp blas quantization meta-programming cpp23

Updated Aug 27, 2025
C++

JaneaSystems / jecq

Star

Faiss-based library for efficient similarity search

machine-learning quantization semantic-search product-quantization similarity-search faiss rag vector-search recommendation-systems vector-database retrieval-augmented-generation iterative-quantization

Updated Jul 31, 2025
C++

KredeGC / BitStream

Star

A header-only library for serializing and quantizing bits

c-plus-plus serialization cpp header-only cpp17 quantization template-library bitpacking header-library bitpacker header-only-library

Updated Jul 19, 2025
C++

gaoj0017 / RaBitQ

Star

[SIGMOD 2024] RaBitQ: Quantizing High-Dimensional Vectors with a Theoretical Error Bound for Approximate Nearest Neighbor Search

nearest-neighbor-search quantization high-dimensional-vectors

Updated Jun 5, 2025
C++

VectorDB-NTU / Extended-RaBitQ

Star

[SIGMOD 2025] Practical and Asymptotically Optimal Quantization of High-Dimensional Vectors in Euclidean Space for Approximate Nearest Neighbor Search

nearest-neighbor-search quantization vector-database