Тема 1. Технические средства анализа данных и машинного обучения. Краткое повторение основ Python. Средства разработки. Библиотеки для работы с различными видами данных (numpy, pandas, xarray). Вычислительные ресурсы. Разведочный анализ данных, визуализация данных и распределений данных.
Тема 2. Вероятностная постановка задач МО. Метод максимального правдоподобия. Линейная регрессия как метод МО в задаче восстановления регрессии. Функции потерь линейной регрессии. Логистическая регрессия как метод МО в задаче классификации. Функция потерь логистической регрессии.
Тема 3. Методология подхода машинного обучения. Признаковое описание объектов и событий в машинном обучении. Общая последовательность решения задач обучения с учителем. Нормирование признакового описания. Оценка качества моделей МО. Подход скользящего контроля. Гиперпараметры моделей МО и их оптимизация. Неопределенность в задачах МО. Оценка неопределенностей меры качества, параметров моделей, целевой переменной. Метод бутстреп. Особенности гидрометеорологических данных в контексте МО (автокорреляция, связи с запаздыванием, наличие суточной и сезонной изменчивости и т.д.). Реализация основных этапов решения задач МО средствами библиотеки scikit-learn.
Тема 4. Обзор основных методов машинного обучения. Параметрические и непараметрические методы. Принципы построения моделей различных видов. Оптимизация параметрических моделей, методы градиентной оптимизации. Непараметрические модели, оптимизация непараметрических моделей. Ансамблевые модели и их оптимизация. Реализация ансамблевых моделей МО средствами библиотеки scikit-learn.
Тема 5. Краткое знакомство с методами глубокого обучения. Полносвязная искусственная нейронная сеть (MLP) как параметрическая модель МО. Использование реализации MLP из пакета scikit-learn
Тема 6. Применение методов МО. Постановки задачи аппроксимации, прогноза, статистического даунскейлинга. Интерпретация результатов применения методов МО. Оценка значимости признаков. Применение методов МО для факторного анализа в гидрометеорологических задачах.
Тема 7. Методы МО для решения задач типа "Обучение без учителя". Снижение размерности, идентификация аномалий, кластеризация и связь между этими задачами.