Фонд «Интеллект»

В осеннем семестре впервые стартовал межфакультетский офлайн-курс от фонда «Интеллект» на английском языке

21.11.2024

В осеннем семестре стартовал межфакультетский офлайн-курс от фонда «Интеллект» на английском языке. Курс состоит из 12 лекций.

Цель курса «Introduction to natural language processing and text analytics» состоит в развитии профессиональной исследовательской и информационно-коммуникационной компетенции исследователя. Практическим результатом прохождения курса станет защита проекта «Корпусное исследование статей по проблематике научного интереса студента».

Курс проводится полностью на английском языке, поэтому пользуется популярностью среди иностранных студентов международных программ разных факультетов. В том числе, в полном составе курс посещают магистранты подобной программы с механико-математического факультета.

«Ребята активно участвуют в дискуссиях и подходят с вопросами после пар. Обсуждения принимают увлекательный характер, потому что о популярных технологиях говорят будущие специалисты из разных областей: математики с ВМК могут подправить код, психологи и нейробиологи поставить под сомнение популярные гипотезы о природе генеративных технологий, филологи привести хорошие примеры к лингвистическим теориям, составляющим базу обработки речи технологиями ИИ», – отметила Анна Авраменко, автор курса, кандидат педагогических наук, доцент кафедры лингвистики и информационных технологий факультета иностранных языков и регионоведения МГУ имени М.В. Ломоносова.

С теоретической точки зрения, курс включает в себя описание принципов обработки естественного языка и методов работы больших языковых моделей, для чего происходит ознакомление студентов с основами когнитивной, корпусной и компьютерной лингвистики, а также дистрибутивной семантики. Все лекции сопровождаются анализом эмпирического материала и демонстрацией инструментов обработки естественного языка в рамках раздела case study для решения следующих прикладных задач:

  • поиск и систематизация научных материалов;
  • пред- и постредактирование текстов для осуществления их машинного перевода;
  • выделение наиболее частотных терминов, персоналий и других языковых единиц, отражающих тенденции исследований;
  •  определение авторства текстов;
  •  автоматизация сбора количественных и качественных данных.

«Над курсом я работаю с начала лета, стараясь обобщить постоянно обновляющуюся теорию и поделиться небольшим практическим опытом, который у меня есть по теме (я являюсь участником проекта НОШ МГУ). Ранее я читала два межфакультетских курса на русском языке, но они были рассчитаны больше на аудиторию гуманитарных факультетов. Поскольку на данном курсе встретились студенты разных направлений и программ, он требует гораздо более многосторонней подготовки, но и приносит огромное удовлетворение», – добавила Анна Авраменко.

Все материалы курса и ссылки на трансляции лекций доступны на сайте teach-in.ru