NeuralTower

NeuralTower - открытый инженерный проект настольной рабочей станции на четырех NVIDIA Tesla V100 SXM2 32 GB. Цель проекта - собрать локальный узел с 128 GB HBM2 для инференса и экспериментов с большими моделями без постоянной зависимости от облака.

Проект находится в стадии проектирования и доводки. В репозитории отдельно лежат расчеты, механика, электрическая часть, подготовка железа, программная среда и статьи о проекте. Если обзорный текст расходится с инженерным документом, для сборки нужно использовать инженерный документ.

Быстрая навигация

Раздел	Назначение
Docs/project_status.md	Текущий статус узлов, неподтвержденные гипотезы и план первичной проверки
Docs/BOM/bom_list.md	Перечень компонентов, материалов и закупочных позиций
Docs/Calculations/air_dynamics.md	Расчет воздушной части V-CORE
CAD/Deck/deck_layout.md	Геометрия палубы, сопел и технологических проходов
Electrical/Pinouts/slimsas_mapping.md	Топология SlimSAS, слоты PCIe и порядок GPU
Hardware/BIOS/bios_settings.md	Настройки BIOS для V100, PLX и PCIe
Software/Linux/system_setup.md	Порядок подготовки ОС и первого запуска
Diagnosis/V100-SXM2-32G	Контейнер диагностики четырех V100 SXM2

Архитектура

Система строится вокруг четырех Tesla V100 SXM2, установленных на двух SXM2 carrier board. Внутри каждого мезонина пара GPU связана NVLink 2.0, а межмезонинный обмен идет через PCIe 3.0 x16, SlimSAS SFF-8654 8i и PLX-коммутаторы материнской платы ASUS X99-E WS.

Основной инженерный компромисс проекта: V100 уже не современная архитектура, но дает большой объем HBM2 на вторичном рынке. Для программного стека это означает обязательную работу с ограничениями Volta sm_70: CUDA 12.8, FP16 как базовый тип данных и отдельная стратегия для vLLM.

Охлаждение V-CORE

V-CORE - рабочее название схемы охлаждения, где жидкостный контур снимает основную тепловую нагрузку с CPU и GPU, а нижний отсек корпуса работает как камера избыточного давления. Воздух проходит через радиаторы СЖО, попадает в герметичный КВД и выходит через калиброванные сопла палубы к VRM, обратным сторонам плат и зонам, не закрытым водоблоками. Два блока питания HX1000 находятся в изолированных боковых отсеках и не используют воздух КВД.

Основные документы по этой теме:

механика палубы: CAD/Deck/deck_layout.md;
аэродинамический расчет: Docs/Calculations/air_dynamics.md;
гидравлика СЖО: Docs/Calculations/coolant_hydraulics.md;
объем теплоносителя: Docs/Calculations/coolant_volume.md.

Программный стек

Основной путь развертывания: Gentoo Linux, CUDA 12.8, NVIDIA driver 580+, Python 3.12 и 1Cat-vLLM для восстановления рабочей поддержки V100. Альтернативный путь - официальный vLLM ветки 0.18.x с Triton-бэкендом, если форк 1Cat-vLLM не подходит.

Стартовые документы:

Software/Linux/system_setup.md - порядок подготовки системы и ссылки на подробные инструкции;
Software/Linux/gentoo_optimization.md - параметры Gentoo и ядра;
Software/Linux/world_build.md - воспроизводимая сборка окружения;
Software/Linux/vllm_optimization.md - запуск vLLM, TP/PP, NVMe swap и NCCL.

Безопасность

В проекте используются высокие токи, два блока питания, жидкостное охлаждение и дорогое серверное оборудование. До подачи питания обязательны проверка распиновок, прозвонка переходников, контроль общей земли между БП и рамой, наружный доступ к выключателям HX1000, тест герметичности СЖО и проверка работы помп.

Связанные документы:

Структура репозитория

NeuralTower/
├── Articles/              # публикации и черновики статей
├── CAD/                   # механическая компоновка и сборка
├── Diagnosis/             # аппаратные тесты GPU
├── Docs/
│   ├── BOM/               # перечень компонентов
│   ├── Calculations/      # расчетные записки
│   └── Images/            # логотип, схемы и будущие фотографии
├── Electrical/            # питание, земля, распиновки
├── Hardware/              # GPU, BIOS, аппаратная подготовка
├── Manuals/               # внешние мануалы и справочные материалы
└── Software/              # ОС, ML-стек, мониторинг

Связь

Группа в Telegram: @NeuralTower

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NeuralTower

Быстрая навигация

Архитектура

Охлаждение V-CORE

Программный стек

Безопасность

Структура репозитория

Связь

About

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 97 Commits
.github		.github
Articles		Articles
CAD		CAD
Diagnosis/V100-SXM2-32G		Diagnosis/V100-SXM2-32G
Docs		Docs
Electrical		Electrical
Hardware		Hardware
Manuals		Manuals
Software		Software
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

NeuralTower

Быстрая навигация

Архитектура

Охлаждение V-CORE

Программный стек

Безопасность

Структура репозитория

Связь

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages