[stepik] Практический Machine Learning (2022)
Описание:
Чему вы научитесь
- • Изучите классические и современные алгоритмы машинного обучения
- • Повторите или освоите математические подходы, необходимые для анализа данных
О курсе
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Важно! Курс находится в процессе наполнения.
Программа курса
Организация курса
- • О курсе
- • Инструменты
- • Kaggle
Знакомство с машинным обучением
- • Введение
- • Основные понятия машинного обучения
- • Типы задач в машинном обучении
- • Схема проекта по машинному обучению
- • Оценка обобщающей способности модели
- • Домашнее задание
- • Разведочный анализ данных
Линейные модели регрессии
- • Основы линейной регрессии
- • Регуляризация
- • Практические особенности линейной регрессии
- • Feature engineering
- • Метрики качества регрессии
- • Домашнее задание
Линейные модели классификации - 1
- • Переход от регрессии к классификации
- • Задача оценивания вероятностей, логистическая регрессия
- • Базовые метрики классификации
- • Домашнее задание
Линейные модели классификации - 2
- • Метод опорных векторов
- • Ядровой метод опорных векторов
- • Продвинутые (интегральные) метрики классификации
- • Домашнее задание
Многоклассовая классификация
- • Многоклассовая и multilabel-классификация
- • Метод ближайших соседей
- • Быстрый поиск соседей
- • Калибровка вероятностей
Решающие деревья и их композиции
- • Решающее дерево
- • Тонкости решающих деревьев
- • Разложение ошибки на смещение и разброс
- • Бэггинг. Случайный лес
- • Бустинг. Градиентный бустинг над решающими деревьями
- • Современные имплементации градиентного бустинга
Обработка признаков и работа с выбросами
- • Работа с пропущенными значениями
- • Поиск аномалий
- • Кодирование категориальных признаков
Снижение размерности данных
- • Методы отбора признаков
- • Метод главных компонент
- • Сингулярное разложение
- • Линейный дискриминантный анализ
- • Методы визуализации данных
Кластеризация данных
- • K-means
- • Иерархическая кластеризация
- • DBSCAN, HDBSCAN
- • Метрики качества кластеризации
- • Графовая кластеризация
Интерпретируемость ML-моделей
- • SHAP
- • LIME
Рекомендательные системы и ранжирование
- • Коллаборативная фильтрация
- • Матричные разложения
- • Факторизационные машины
- • ML-подход
- • Метрики качества ранжирования и рекомендаций
- • Ранжирование
AutoML
- • Автоматический подбор гиперпараметров: Optuna
- • Фреймворк для AutoML – H2O
- • Обзор других фреймворков (TPOT, auto-sklearn, MLBox)
Прогнозирование временных рядов
- • Особенности работы с временными рядами
- • Статистические методы прогноза временных рядов
- • Адаптивные модели
- • Прогнозирование временных рядов с помощью ML
- • Библиотеки для анализа временных рядов: prophet
Подробнее:
Скачать: