Я — Junior разработчик, увлеченный магией искусственного интеллекта. Моя страсть — создавать интеллектуальные системы, которые видят, слышат и учатся. Особенно меня вдохновляет компьютерное зрение, обработка звука (музыки и речи) и оптимизация обучения нейронных сетей. Верю в потенциал ИИ для преобразования мира и постоянно ищу новые вызовы с возможностями для роста.
Сам по себе я дипломированный инженер в сфере электроники и наноэлектроники с богатым опытом взаимодействия с IT-сферой. С детства я был увлечён программированием, а мой любимый комиксный герой — Тони Старк (Железный человек). Думаю, вы понимаете, что стремление создавать что-то необычное и инновационное у меня в крови 😏
Начало домашнего программирования у меня началось благодаря многим известному AlexGyver и воплащении в реальность с уже своими собственными доработками его еще более известного проекта Огненная Wi-Fi лампа GyverLamp. В итоге мой уровень домашнего программирования дошел до возможностей наказывать буйных соседей, путем отключения/вечной перезагрузки их WI-FI роутеров и прочих вытекающих из этого возможностей😈
Мой профессиональный путь начался с 5 лет работы в Службе-112 (911) в должности главного специалиста по защите информации. Эта работа позволила мне глубже погрузиться в мир IT, понять, как работают сложные системы, и научиться эффективно решать задачи пользователей. В конечном итоге мои увлеченность, понимание и назойливость привели к предложению присоединиться к команде разработчиков программного обеспечения Службы-112 в компании ISKRATEL.
Год назад я открыл для себя искусственный интеллект и полностью погрузился в изучение нейросетей. Этот мир привлёк меня своей перспективностью, сложностью и возможностью сочетать аналитическое мышление с креативным подходом. Сейчас я активно работаю над проектами, которые помогают улучшить качество жизни с помощью технологий.
- Разработка и обучение нейросетей
- Работа с видео, изображениями, музыкой/голосом (распознавание, генерация)
- Оптимизация обучения нейронных сетей
- Решение сложных задач в области анализа данных
- Описание: AIChatFlutter – это кроссплатформенное чат-приложение с интеграцией искусственного интеллекта. Оно позволяет пользователям общаться с различными языковыми моделями, отслеживать расход токенов и управлять историей сообщений. Поддерживает работу на Android, iOS, Windows и Linux.
- Стек: Flutter, Dart, OpenAI API, VseGPT.ru API, fl_chart.
- Особенности:
- Общение с разными языковыми моделями.
- Выбор модели из списка доступных.
- Отображение баланса ($/₽) и подсчет стоимости сообщений.
- Сохранение и экспорт истории чатов (JSON).
- Аналитика: статистика использования, расход токенов, анализ времени ответа.
- Темный режим, адаптивный дизайн, поддержка русского и английского языков.
- Кроссплатформенность, офлайн-доступ к истории, обработка сетевых ошибок.
- Ссылка на презентацию: AIChatFlutter – Презентация проекта
- Ссылка на видео: AIChatFlutter – Видеообзор проекта
- Описание: Борис — это виртуальный консультант по искусственному интеллекту, построенный на основе передовой технологии Retrieval Augmented Generation (RAG). Он способен понимать сложные вопросы по ИИ и давать точные, безопасные и "человечные" ответы, опираясь на обширную базу знаний, составленную из аннотаций статей с arXiv.org. В отличие от обычных чат-ботов, Борис не просто генерирует текст, а ищет и анализирует релевантную информацию перед тем, как сформулировать ответ. Это обеспечивает более высокую точность и достоверность информации. Проект демонстрирует применение современных методов оптимизации RAG-систем, таких как реранжирование, ресортировка контекста, преобразование запросов и параллельная обработка данных. Полная визуализированная версия проекта доступна по ссылке.
- Стек: Python, LlamaIndex, GPT-4o (OpenAI), Saiga Mistral 7b LoRA, Llama Guard, Phoenix, Arxiv, Hugging Face Hub.
- Особенности:
- Retrieval Augmented Generation (RAG): Позволяет боту основывать свои ответы на реальных данных, а не только на обучающих данных языковой модели.
- Фильтрация запросов и ответов (Llama Guard): Обеспечивает безопасность и предотвращает нежелательные ответы.
- Трассировка и анализ работы LLM (Phoenix): Позволяет выявить слабые места и галлюцинации модели, а также оптимизировать ее производительность.
- Оптимизация RAG-системы: Применены передовые методы для повышения точности и эффективности системы.
- Сравнение разных LLM: Проведено сравнение gpt-4o и Saiga Mistral 7b LoRA для выбора наиболее подходящей модели.
- Фокус на ИИ: Специализация бота на теме искусственного интеллекта делает его ценным источником информации в этой области.
- Описание: Проект посвящен улучшению качества изображений низкого разрешения с помощью магии глубокого обучения. Я исследовал и сравнил несколько архитектур автоэнкодеров, включая простой автоэнкодер, автоэнкодер с пакетной нормализацией, глубокий автоэнкодер и, конечно же, мощную U-Net. Обучение проводилось на высококачественном датасете DIV2K, а для оценки результатов использовались стандартные метрики PSNR и SSIM.
- Стек: Python, TensorFlow/Keras, PSNR/SSIM, OpenCV (cv2), Matplotlib, NumPy, Scikit-image, Scikit-learn.
- Особенности:
- Проект не просто реализует одну модель, а сравнивает несколько архитектур, что делает его более ценным с точки зрения исследования.
- Использование U-Net, известной своей эффективностью в задачах сегментации и повышения разрешения изображений.
- Применение качественного датасета DIV2K обеспечивает надежность полученных результатов.
- Использование объективных метрик PSNR и SSIM для количественной оценки качества изображений.
- Визуализация процесса обучения и результатов повышения разрешения помогает лучше понять работу моделей.
- Наличие подробного описания проблемы, концепций и результатов делает проект более понятным и доступным.
- Описание: Этот проект превращает простые рисунки в цифровые шедевры распознавания! Я создал интерактивное веб-приложение, где пользователи могут рисовать от руки различные объекты, а мой классификатор, основанный на нейронной сети и наборе данных Google Quick, Draw, мгновенно определяет, что изображено. Сердцем приложения служит быстрый и эффективный REST API, построенный на FastAPI.
- Стек: Python, TensorFlow/Keras, FastAPI, Uvicorn, Pyngrok, Requests, PIL (Pillow), Matplotlib, NumPy, Pandas, Tabulate.
- Особенности:
- Пользователи могут рисовать прямо в браузере, что делает приложение удобным и захватывающим.
- Использование FastAPI обеспечивает высокую производительность и быструю обработку запросов.
- Обучение на большом и разнообразном наборе данных Google Quick, Draw позволяет классифицировать широкий спектр объектов.
- Применение сверточной нейронной сети обеспечивает высокую точность распознавания изображений.
- Создание REST API делает модель доступной для использования в других приложениях.
- Упрощенные тестирование и демонстрация приложения за счет Ngrok.
- Отображение вероятностей классов и круговой диаграммы помогает пользователям понять, как работает классификатор.
- Описание: Этот проект — поединок двух гигантов обучения с подкреплением: Deep Deterministic Policy Gradient (DDPG) и Proximal Policy Optimization (PPO)! Я бросил их в бой со сложной средой BipedalWalker-v3 из Gymnasium, где двуногому роботу предстояло научиться ходить по неровной местности. Цель была выявить, кто из них способен обучить более эффективную и стабильную походку.
- Стек: Python, PyTorch, Gymnasium, SWIG, Collections.deque, NumPy, Matplotlib.
- Особенности:
- Использование сложной среды BipedalWalker-v3 позволяет продемонстрировать эффективность алгоритмов в условиях, близких к реальным.
- Сравнение двух популярных алгоритмов RL, имеющих разные подходы к обучению.
- Помимо эффективности (награды), проект также учитывает стабильность обучения, что важно для практического применения RL.
- Результаты проекта могут быть полезны для разработки алгоритмов управления роботами.
- Описание: В этом проекте я исследовал, как фоновый шум влияет на "слух" компьютера. Я построил систему распознавания речи на Python и проверил, насколько хорошо она справляется с расшифровкой аудиозаписей с добавленным белым шумом.
- Стек: Python, SpeechRecognition, pydub, Google Speech Recognition API, FFmpeg, Jupyter Notebook.
- Особенности:
- Проект специально разработан для исследования влияния шума на точность распознавания речи.
- Использование метрики Accuracy позволяет объективно оценить эффект добавления шума.
- Применение широко используемого и эффективного Google Speech Recognition API для распознавания речи.
- Результаты проекта могут быть использованы для разработки более устойчивых систем распознавания речи.
- роект включает анализ полученных данных и выводы о влиянии шума.
- Описание: В этом проекте я научил компьютер "видеть" дорожные знаки так же хорошо, как и опытный водитель! Я использовал мощную модель YOLOv8 для обнаружения дорожных знаков на изображениях и видео.
- Стек: Python, Ultralytics YOLO, PyTorch, OpenCV (cv2), PIL (Pillow), Matplotlib, MoviePy, TensorBoard, Jupyter Notebook.
- Особенности:
- Использование современной и высокоэффективной модели YOLOv8 для обнаружения объектов.
- Модель способна обрабатывать как статические изображения, так и видеопоток.
- Отображение ограничивающих рамок вокруг обнаруженных знаков делает результаты наглядными.
- Использование precision, recall, mAP и confusion matrix позволяет всесторонне оценить производительность модели.
- Проект имеет практическую значимость для развития современных автомобильных технологий.