DevGeek (id777126) — Блог на vc.ru

Дёшево как DeepSeek, умно как Sonnet? Проверяю Step 3.5 Flash на боте для своего канала

$0.10 за миллион input-токенов и $0.30 за output — самая агрессивная цена на рынке среди моделей с поддержкой tool use. Взял реальную задачу: Telegram-бот на C# под Ubuntu, который пинает меня когда меняется счётчик подписчиков канала. Подключил через Cline. Делюсь логом, кодом и фейлами.

1 ответ на пост

DevGeek

вчера

Claude больше не будет ждать команд. Anthropic делает ИИ, который угадывает, что вам нужно

Глава продукта Claude Code рассказала, как ИИ-ассистент превратится из «инструмента по запросу» в проактивного коллегу — и почему это произойдёт уже в ближайшие полгода.

DevGeek

8 мая

Как срезать расход токенов в Claude Code на 90%: 10 GitHub-репозиториев, рабочий стек и нативные команды, которые все игнорируют

Типичная сессия в Claude Code сжигает 80 000–200 000 токенов за несколько часов работы. Когда лимит упирается посреди рефакторинга в пятницу вечером — фича уезжает на понедельник. Это не теоретическая проблема, это вопрос дедлайнов.

DevGeek

7 мая

Топ-5 бесплатных моделей на OpenRouter в мае 2026

OpenRouter продолжает поддерживать бесплатный доступ к мощным языковым моделям, делая ИИ доступным для разработчиков и энтузиастов. Разберём пятёрку самых популярных бесплатных моделей по объёму использования и посмотрим, что у каждой под капотом.

DevGeek

7 мая

DeepSeek-TUI — новый ИИ-агент для кода в терминале. Дешёвая альтернатива Claude Code: настройка через OpenRouter и первый проект

Поставил, подключил через OpenRouter, попросил собрать Pomodoro-таймер с фронтом на React и бэком на ASP.NET Core. За 3 минуты и 10 центов получил рабочее приложение. Делюсь подробностями.

DevGeek

6 мая

Локальный AI-кодинг в 2026: тестирую Qwen3 35B на RTX, разбираю настройку Cline и пишу Pomodoro

Подписки на Cursor и Copilot за последний год выросли, лимиты ужесточились, а вопрос «куда уходит мой код» стал звучать всё чаще. Я решил проверить, насколько готова альтернатива — локальная LLM на домашнем ПК. Конфиг подопытного: i7-14700K, 32GB RAM, 16GB VRAM. Модель — Qwen3 35B A3B в кванте Q3_K_S. Архитектура MoE здесь ключевая: при 35B общих п…

DevGeek

4 мая

От 13 до 73 токенов в секунду: разгоняем нейросеть Nemotron дома

NVIDIA в марте 2026 выпустила Nemotron-Cascade-2-30B-A3B — нейросеть, которая взяла золото на трёх главных мировых соревнованиях по математике и программированию: IMO (международная олимпиада по математике для школьников), IOI (то же самое, но по информатике) и финале ICPC (главный командный чемпионат мира по программированию среди студентов — там…

DevGeek

4 мая

Без программистов и за месяц: как 3 стартапа из YC построили компании на Claude Code

В апреле 2025 года двое ребят без инженерного опыта основали стартап. Через месяц у них был прототип. Ещё через месяц - контракт с губернатором Вирджинии, выигранный у крупных консалтинговых фирм. К концу года - $11 млн посевных инвестиций.

DevGeek

3 мая

9 главных LLM 2026 года: какую модель брать под какую задачу

Полный разбор флагманов от OpenAI, Anthropic, Google и китайских вендоров — с ценами, бенчмарками и практическими рекомендациями.

DevGeek

24 апр

Два MoE-монстра на одной машине: запускаем и тестируем локально новейшую версию Qwen3.6-35B-A3B и сравниваем с Gemma 4-26B-a4b

DevGeek

12 апр

Как правильно проверять локальные языковые модели

Локальные LLM стали реальной альтернативой облачным API. Llama, Mistral, Gemma, Qwen, Phi — семейств десятки, и выбор между ними далеко не очевиден. Скачать модель легко. Понять, подходит ли она именно вам, — сложнее.

DevGeek

5 апр

Запускаем Gemma 4 32B дома — проверяем на реальных задачах

Локальные модели становятся всё интереснее — и Gemma 4 32B стала хорошим поводом это проверить. Никакого облака, никаких API-ключей, никакой абонентской платы. Всё работает на своём железе, данные никуда не уходят.

DevGeek

По каким бенчмаркам сравнивают модели в 2026 году

1. Зачем это вообще нужно?