Data Scientist: от данных до деплоя моделей
Практический курс по Data Science: от постановки ML-задачи и работы с данными до inference API, CI/CD и мониторинга моделей в продакшне. Вы пройдёте EDA, feature engineering, обучение и оценку моделей, experiment tracking, error analysis и deployment — чтобы собирать полноценный рабочий контур вокруг ML-решения.

О курсе
Подробнее о курсе
Этот курс посвящён полному прикладному циклу Data Science: от постановки ML-задачи и анализа данных до сервиса предсказаний, CI/CD и мониторинга модели в продакшне. Вместо абстрактного “обучили модель в ноутбуке и пошли дальше” Вы пройдёте весь рабочий контур, который нужен в реальных проектах: формализация задачи, выбор метрик, проверка качества данных, поиск утечек, построение признаков, обучение baseline- и gradient boosting-моделей, experiment tracking, оценка качества, error analysis, model serving, автоматические проверки и мониторинг после релиза. В курсе отдельно разобраны важные практические темы, которые часто упускают в классических ML-курсах: reproducibility, data leakage, стабильность признаков, ложное улучшение качества, API-контракт для inference, batch-inference, тестирование data pipeline и inference API, quality gates перед деплоем, data drift и prediction drift. Курс подойдёт тем, кто хочет не просто запускать модели, а понимать, как довести ML-решение до рабочего продакшн-сценария: с воспроизводимостью, валидацией, сервисом предсказаний, мониторингом и понятной коммуникацией результатов. Программа курса включает: — постановку ML-задачи и работу с данными; — feature engineering и подготовку признаков; — обучение и валидацию моделей; — experiment tracking и оценку качества; — error analysis и итеративное улучшение; — подготовку модели к деплою; — CI/CD для ML-проектов; — мониторинг и поддержку моделей в продакшне; — коммуникацию результатов и ограничений модели.
Структура курса
