一只云原生萌新

llama.cpp运行最新Qwen3.6-27b-q4模型

环境介绍GPU： 4090 24G显存下载模型安装下载工具apt install -y aria2 -i https://mirrors.cloud.tencent.com/pypi/simple下载模型aria2c -x 16 -s 16 -k 1M https://www.modelscope...

2026-04-24 115 0

0

大模型

4090双卡部署qwen3.5-9B、embeding、rerank模型并测试

部署qwen3.5与embeding模型与rerank模型...

2026-04-21 127 0

0

大模型

4090 VLLM部署Qwen3-8B

模型Qwen2.5-14B-Instruct-AWQ 是阿里云 Qwen2.5 系列中的一个14B（140亿参数）指令微调大语言模型的4bit AWQ量化版本，专为高效推理部署优化，在保持较强的中文、英文理解与生成能力的同时，大幅降低显存占用与计算成本，适合在单卡GPU（如4090/5090）上进行...

2026-04-16 112 0

0

大模型

4090 VLLM部署Qwen2.5-14B-Instruct-AWQ

前置环境租用4090gpu https://ppio.com cuda12.8.1版本安装conda下载wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh安装安装过程中注意：一路回车看到 Do you ...

2026-04-14 121 0

0

大模型

4090 SGLang部署Qwen3.5-9B小模型

本文介绍了如何在消费级显卡上使用SGLang框架推理千问最新发布Qwen3.5-9B版本的小模型，无坑版本，可直接运行，显卡是autodl租的，官网：https://autodl.com配置参数如下：创建虚拟环境SGLang + FlashAttention 在 3.10 最稳conda creat...

2026-04-13 141 0

0

大模型

快速部署测试k8s集群

部署集群参考文档: https://blog.csdn.net/weixin_32089639/article/details/148162370部署存储SClocal-pathkubectl apply -f https://raw.githubusercontent.com/rancher/lo...

2025-09-23 371 0

0

Kubernetes

分布式缓存一致性Hash

背景一致性哈希（Consistent Hashing）的出现，源于大规模分布式系统中面临的一个核心问题：当我们将数据或缓存分布在多个节点（机器）上时，如何让 key 分布合理、节点可扩缩容，并保持缓存命中率稳定？传统哈希的缺陷（背景问题）nodeIndex = hash(key) % NN 是节点数...

2025-05-03 584 0

0

居家摸鱼 #奇奇怪怪的知识

使用docker-compose搭建mysql主从数据库

环境信息操作系统：WIndows11mysql版本： mysql8.0开始搭建文件目录如下：C:\mysql-cluster├── docker-compose.yml├── master│ ├── data│ └── my.cnf└── slave ├── data └── m...

2025-04-13 570 0

0

居家摸鱼 #中间件

go get拉取私有仓库代码(Gitlab)

go get拉取私有仓库代码在日常开发中，大家可能使用私有仓库路比较多，比如gitlab，我是一名go程序员，当我想使用我gitlab中其他仓库的代码应该怎么做呢？今天下午折腾了一下，也遇到了不少坑，放在这里给自己做笔记，同时为大家提供思路环境假设：你的GITLAb仓库： https://gitla...

2024-11-26 1051 0

0

居家摸鱼

《BPF之巅》学习笔记

...

2024-11-09 707 0

0

居家摸鱼