Computer Vision Engineer: от детекции и Doc-AI до продакшна
Практический курс по Computer Vision. Соберёте продакшн-сервис: датасет → обучение (YOLO/RT-DETR, SAM), трекинг, OCR/Doc-AI, веб-приложение (UI+API) и мониторинг. Экспорт в ONNX/TensorRT/OpenVINO, батчинг/квантование под CPU/GPU. Плюс профессиональные блоки: mAP/IoU/Dice и калибровка доверия, QA разметки и аугментации, p95/стоимость, дрейф данных и алерты, guardrails (NMS/правила), A/B-тесты, Triton/gRPC/FastAPI.

О курсе
Подробнее о курсе
Этот курс — про продакшн-компьютерное зрение. Вы пройдёте путь от данных и разметки до работающего сервиса с метриками качества, скорости и стоимости инференса. Мы не ограничиваемся ноутбуками: строим сервисы, считаем p95-латентность и cost/1000 кадров, настраиваем мониторинг и приватность. Что внутри. Детекция и сегментация (YOLOv8/YOLO11, RT-DETR, SAM), Doc-AI (PaddleOCR + LayoutParser), экспорт и ускорение (ONNX/TensorRT/OpenVINO, квантизация INT8, батчинг, динамические инпуты), сервисный слой (FastAPI, очереди Redis/RabbitMQ, rate-limit, ретраи), деплой (Docker/Compose, канареечные релизы), наблюдаемость (Prometheus/Grafana, структурированные логи, алерты). Практика и артефакты. Retail: детектор пустых полок → mAP, p95, cost/req, дашборд. Пром: сегментация дефектов → IoU/Dice, отчёт по браку для менеджмента. Офис: Doc-AI для чеков/актов → JSON → БД, SLA эндпоинта. Каждый модуль завершается артефактом: модель/скрипт инференса/эндпоинт/отчёт или дашборд. Все репозитории воспроизводимы (Makefile, docker-compose, инструкции «из коробки»). Почему это ценно. Вы научитесь не только обучать модели, но и обосновывать ROMI: корректно мерить качество, latency и стоимость, находить узкие места, безопасно обновлять модели (канарейка/shadow), соблюдать политику PII (маскирование лиц/номеров, аудит доступа). Формат: короткая теория → код → автопроверки/чек-листы → мини-итог. Финал — деплой сервиса с мониторингом и отчётом метрик.
Структура курса
