[Stepik] Практический Machine Learning (2023)
Чему вы научитесь:
- Изучите классические и современные алгоритмы машинного обучения
- Повторите или освоите математические подходы, необходимые для анализа данных
О курсе:
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Программа курса:
Организация курса
- О курсе
- Инструменты
- Kaggle
Знакомство с машинным обучением
- Введение
- Основные понятия машинного обучения
- Типы задач в машинном обучении
- Схема проекта по машинному обучению
- Оценка обобщающей способности модели
- Домашнее задание
- Разведочный анализ данных
Линейные модели регрессии
- Основы линейной регрессии
- Регуляризация
- Практические особенности линейной регрессии
- Feature engineering
- Метрики качества регрессии
- Домашнее задание
Линейные модели классификации - 1
- Переход от регрессии к классификации
- Задача оценивания вероятностей, логистическая регрессия
- Базовые метрики классификации
- Домашнее задание
Линейные модели классификации - 2
- Метод опорных векторов
- Ядровой метод опорных векторов
- Продвинутые (интегральные) метрики классификации
- Домашнее задание
Многоклассовая классификация
- Многоклассовая и multilabel-классификация
- Метод ближайших соседей
- Быстрый поиск соседей
- Калибровка вероятностей
Решающие деревья и их композиции
- Решающее дерево
- Тонкости решающих деревьев
- Разложение ошибки на смещение и разброс
- Бэггинг. Случайный лес
- Бустинг. Градиентный бустинг над решающими деревьями
- Современные имплементации градиентного бустинга
Обработка признаков и работа с выбросами
- Работа с пропущенными значениями
- Поиск аномалий
- Кодирование категориальных признаков
Снижение размерности данных
- Методы отбора признаков
- Метод главных компонент
- Сингулярное разложение
- Линейный дискриминантный анализ
- Методы визуализации данных
Кластеризация данных
- K-means
- Иерархическая кластеризация
- DBSCAN, HDBSCAN
- Метрики качества кластеризации
- Графовая кластеризация
Интерпретируемость ML-моделей
- SHAP
- LIME
Рекомендательные системы и ранжирование
- Коллаборативная фильтрация
- Матричные разложения
- Факторизационные машины
- ML-подход
- Метрики качества ранжирования и рекомендаций
- Ранжирование
AutoML
- Автоматический подбор гиперпараметров: Optuna
- Фреймворк для AutoML – H2O
- Обзор других фреймворков (TPOT, auto-sklearn, MLBox)
Прогнозирование временных рядов
- Особенности работы с временными рядами
- Статистические методы прогноза временных рядов
- Адаптивные модели
- Прогнозирование временных рядов с помощью ML
- Библиотеки для анализа временных рядов: prophet
Подробнее:
Скачать: