llmlingua

Here are 9 public repositories matching this topic...

jia-gao / leanctx

Drop-in prompt compression for production LLM apps. Cut your token bill 40-60% without changing your code. Python SDK, LLMLingua-2, MIT.

python gemini openai cost-optimization rag llm langchain anthropic llm-inference prompt-compression langgraph llmlingua

Updated Jun 8, 2026
Python

atjsh / llmlingua-2-js

Star

JavaScript/TypeScript implementation of LLMLingua-2 (Experimental)

nodejs javascript typescript web tensorflow transformers webgpu hf tensorflowjs prompt-engineering transformer-js prompt-compression llmlingua

Updated Sep 14, 2025
TypeScript

centminmod / or-cli

Sponsor

Star

Python command-line tool for interacting with AI models through the OpenRouter API/Cloudflare AI Gateway, or local self-hosted Ollama. Optionally support Microsoft LLMLingua prompt token compression

openai linkup opik rag openai-api txtai llms llm-inference openrouter ollama cloudflare-ai ollama-api prompt-compression structured-outputs openai-api-client openrouter-api cloudflare-ai-gateway ai-rag llmlingua

Updated Dec 28, 2025

mo-tunn / TokenPack

Star

TokenPack packs long documents, codebases, PDFs, and folders into compact, evidence-dense LLM context using local embeddings, evidence scoring, and budget-aware selection.

python cli mcp agents semantic-search rag pdf-processing sentence-transformers document-ai llm long-context retrieval-augmented-generation context-compression llmlingua context-packing

Updated May 14, 2026
Python

g-akshay / ClaudeShrink

Sponsor

Star

A Claude Code skill that shrinks massive prompts and files using LLMLingua to save tokens.

skills developer-tools claude ai-tools context-window prompt-compression llmlingua claude-code token-optimization claude-skills

Updated Apr 25, 2026
Python

gladehq / claude-shorthand

Star

LLMLingua-2 prompt compression hook for Claude Code — cut token usage by ~55%

macos linux cli developer-tools token claude prompt-tuning llm prompt-engineering prompt-compression llmlingua token-optimization claudecode claudecode-hooks claudecode-plugin

Updated Mar 16, 2026
Python

kai63001 / SummarizeIt

Star

Instant text, video & audio summaries on iOS Flutter client · Python (llmlingua) & Node.js (Whisper) services · MongoDB · RevenueCat IAP

nodejs flutter summaries whisper-cpp llmlingua

Updated Jun 17, 2025
Dart

darekcze / tokensqueeze

Star

Hybrid prompt compression toolkit for LLM workflows

cli tokens vscode-extension fastapi llm prompt-compression llmlingua

Updated May 4, 2026
Python

finktech-dev / llm-zip

Star

Self-hosted HTTP sidecar for LLM context compression. Reduce token costs 3–5× before calling any AI API — powered by LLMLingua-2 and MarkItDown. No proxy, no API keys, no GPU required.

python docker self-hosted rag fastapi llm prompt-compression context-compression llmlingua token-optimization

Updated Jun 10, 2026
Python

Improve this page

Add a description, image, and links to the llmlingua topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the llmlingua topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

llmlingua

Here are 9 public repositories matching this topic...

jia-gao / leanctx

atjsh / llmlingua-2-js

centminmod / or-cli

mo-tunn / TokenPack

g-akshay / ClaudeShrink

gladehq / claude-shorthand

kai63001 / SummarizeIt

darekcze / tokensqueeze

finktech-dev / llm-zip

Improve this page

Add this topic to your repo