Тема 1. Технологии искусственного интеллекта в корпусной и когнитивной лингвистике. Практическое задание по составлению глоссария по выбранной теме на основе Национального корпуса русского языка.
Тема 2. Введение в программирование на Python: организация кода. Практическое задание по решению элементарных задач в одном из блокнотов IDE.
Тема 3. Подготовка текстовых данных: токенизация, лемматизация, разметка частей речи и морфологический анализ.
Практическое задание по очистке текста в NLTK.
Тема 4. Базовая инфраструктура для обработки естественного языка: основные библиотеки (Pandas, NumPy, etc.) и фреймворки (Keras, TensorFlow, PyTorch). Практическое задание по ознакомлению с github.
Тема 5. Представление текста в многомерном пространстве: векторизация (на примере языковой модели word2vec). Практическое задание по векторизации текста в Yandex.Datasphere (отечественный аналог Google Colab).
Тема 6. Дистрибутивная семантика: задачи классификации текста (на примере языковой модели GloVe). Практическое задание по классификации текста в Yandex.Datasphere.
Тема 7. Обучение без учителя и машинный перевод. Практическое задание по переводу в Skell от SketchEngine.
Тема 8. Типы нейронных сетей, предобученные модели и трансформеры: BERT, GPTChat, etc. Практическое задание по распознаванию именованных сущностей (NER) на базе датасета DeepPavlov в Yandex.Datasphere.