Orion-zhen

Follow

💥

CUDA Out Of Memory

Orion Orion-zhen

💥

CUDA Out Of Memory

Follow

It's a feature, NOT a bug.

50 followers · 17 following

Achievements

Achievements

Highlights

Developer Program Member

Pinned Loading

our our Public

Orion User's Repository for Arch Linux

Python 3
abliteration abliteration Public

Make abliterated models with transformers, easy and fast

Python 107 40
turboderp-org/exllamav2 turboderp-org/exllamav2 Public

A fast inference library for running LLMs locally on modern consumer-class GPUs

Python 4.4k 325
hiyouga/LLaMA-Factory hiyouga/LLaMA-Factory Public

Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python 64.2k 7.8k
SJTU-IPADS/PowerInfer SJTU-IPADS/PowerInfer Public

High-speed Large Language Model Serving for Local Deployment

C++ 8.5k 461
CrazyBoyM/llama3-Chinese-chat CrazyBoyM/llama3-Chinese-chat Public

Llama3、Llama3.1 中文后训练版仓库 - 微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档。

Python 4.2k 336