Catalogus / назад к курсам
Machine LearningНачальныйPublished

ML Engineer / Data Scientist: табличные модели в продакшн

Практический курс для тех, кто хочет получить навыки ML Engineer / Data Scientist на реальных табличных задачах. В курсе Вы не просто обучите CatBoost/LightGBM, а соберёте полноценный production-style пайплайн: подготовка данных, feature engineering (генерация признаков), корректная валидация, защита от leakage (утечек), тюнинг через Optuna, интерпретация через SHAP, batch-инференс и REST API для предсказаний.

#stepik-import
ML Engineer / Data Scientist: табличные модели в продакшн

О курсе

Подробнее о курсе

Этот курс — про инженерную сборку сильных моделей на табличных данных под реальные задачи. Мы идём от подготовки данных и корректной валидации к CatBoost/LightGBM, feature engineering и тюнингу гиперпараметров (включая Optuna). Дальше — интерпретация модели (feature importance, SHAP) и диагностика типовых провалов качества: leakage, неправильный split, переобучение и ошибки preprocessing. Ничего лишнего: каждое занятие заканчивается артефактом — ноутбук/скрипт, таблица экспериментов, отчёт метрик, сохранённая модель или inference pipeline. В финале Вы соберёте воспроизводимый пайплайн обучения и инференса (batch + простой REST API), который можно положить в GitHub-портфолио.

Записей
1
Slug
ml-engineer-data-scientist-tablichnye-modeli-v-prodakshn

Структура курса

Секции и уроки

8 секц.
Секция 1

Подготовка данных и инфраструктура ML-проекта

5 уроков
Урок 1
Настройка окружения и структура ML-проекта
8 шагов
Урок 2
Версионирование данных и моделей с DVC
9 шагов
Урок 3
Exploratory Data Analysis табличных данных
10 шагов
Урок 4
Обработка пропусков в табличных данных
8 шагов
Урок 5
Кодирование категориальных признаков
9 шагов
Секция 2

Feature Engineering для табличных данных

4 уроков
Урок 1
Генерация признаков на основе бизнес-логики
8 шагов
Урок 2
Полиномиальные признаки и взаимодействия
10 шагов
Урок 3
Агрегатные признаки и группировки
9 шагов
Урок 4
Автоматический Feature Engineering с Featuretools
11 шагов
Секция 3

Обучение моделей CatBoost

4 уроков
Урок 1
Первая модель CatBoost для классификации
9 шагов
Урок 2
Встроенная обработка категорий в CatBoost
5 шагов
Урок 3
Кросс-валидация для CatBoost
7 шагов
Урок 4
CatBoost для задачи регрессии
10 шагов
Секция 4

Обучение моделей LightGBM

4 уроков
Урок 1
Первая модель LightGBM для классификации
7 шагов
Урок 2
Обработка категориальных признаков в LightGBM
8 шагов
Урок 3
Кросс-валидация для LightGBM
7 шагов
Урок 4
LightGBM для задачи регрессии
6 шагов
Секция 5

Тюнинг гиперпараметров моделей

5 уроков
Урок 1
Grid Search для подбора гиперпараметров
8 шагов
Урок 2
Random Search для ускоренного тюнинга
10 шагов
Урок 3
Bayesian Optimization с Optuna
12 шагов
Урок 4
Тюнинг параметров регуляризации
6 шагов
Урок 5
Сравнение стратегий тюнинга
6 шагов
Секция 6

Интерпретация и отладка моделей

6 уроков
Урок 1
Feature Importance в CatBoost и LightGBM
6 шагов
Урок 2
SHAP-значения для глобальной интерпретации
6 шагов
Урок 3
SHAP-значения для локальных предсказаний
5 шагов
Урок 4
Диагностика переобучения и underfitting
8 шагов
Урок 5
Выявление data leakage
9 шагов
Урок 6
Анализ ошибок модели
6 шагов
Секция 7

Автоматизация и deployment моделей

6 уроков
Урок 1
Автоматизация обучения с Python-скриптами
8 шагов
Урок 2
Создание inference pipeline
8 шагов
Урок 3
Unit-тесты для ML-пайплайна
5 шагов
Урок 4
Deployment модели через REST API с FastAPI
7 шагов
Урок 5
Batch-инференс для больших объемов данных
5 шагов
Урок 6
Контейнеризация модели с Docker
8 шагов
Секция 8

Мониторинг моделей в продакшне

6 уроков
Урок 1
Метрики для мониторинга качества модели
7 шагов
Урок 2
Детектирование дрейфа признаков
8 шагов
Урок 3
Детектирование дрейфа предсказаний
8 шагов
Урок 4
Система алертов для деградации модели
9 шагов
Урок 5
Dashboard для визуализации метрик
7 шагов
Урок 6
Стратегия переобучения модели
9 шагов
Поддержка