Сергей Запуниди: «Если хочется расширять научную область, осваивай новые инструменты – нейросети»

09.08.2022

До 19 августа включительно принимаются заявки на курс «Нейронные сети и их применение в научных исследованиях», созданный МГУ имени М.В. Ломоносова при поддержке фонда «Интеллект». О том, кому подойдет этот курс, почему молодым ученым стоить осваивать программирование и когда искусственный интеллект станет умнее человека, рассказал кандидат физико-математических наук, научный сотрудник Физического факультета МГУ, идейный вдохновитель и один из основателей курса Сергей Запуниди.

 

«Сильный искусственный интеллект, равный человеческому, пока не создан»

– Сергей Александрович, что сегодня умеют нейросети?

– Самое интересное – это генерация картинок по текстовому описанию. Яркий результат этого года – DALL•E 2. Некоторые говорят, что дизайнеры больше не нужны, потому что нейросеть пишет картины, рисунки, создает графику по описанию как по техническому заданию. Нейросети окружают нас во всех технологических устройствах, которыми мы пользуемся: фотографии с моего телефонами обрабатываются нейросетью, чтобы сделать их более красивыми, улучшить качество. Нейросеть Google Translate делает перевод для части языков через нейросеть, и мы можем не нанимать переводчиков. Также в технических внутренних областях – предсказание потребления электроэнергии, предсказание продаж в магазине – давно и успешно используются нейросети и более простое классическое машинное обучение.

– В чем нейросеть отстает от человека, если еще есть такие области?

– Есть понятие слабого искусственного интеллекта и сильного искусственного интеллекта. Сегодня мы имеем технологию слабого искусственного интеллекта. Это значит, что он не превосходит человеческий, однако выполняет интеллектуальные задачи – перевод текстов, генерацию и классификацию картинок, может построить траекторию движения по дороге, смотря на окружающие объекты. Однако сильный искусственный интеллект, равный человеческому или превосходящий, пока не создан. Поэтому мы сталкиваемся с ошибками в работе искусственного интеллекта, про которые говорим, что они противоречат здравому смыслу. У нас есть общее понимание жизни, некий здравый смысл и поэтому нам понятно, что эта ошибка, а машине это не очевидно. Если сравнивать искусственный интеллект и человека, то человек пока превосходит в сложности задач, которые он может решать, но у человека есть недостатки – невнимательность, прокрастинация, лень, свободолюбие, которые заставляют его не подчиняться командам. У нейросети есть преимущество – она выполняет поставленную задачу без жалоб, потребляя всего лишь электроэнергию, что очень эффективно и превосходит в цене работы.

– Не страшно ли представить, что искусственный интеллект когда-то станет умнее человека и вообще возможно ли это?

– Да, я считаю, это безусловно, возможно. Развиваются вычислители для вычисления алгоритмов нейронной сети. Человеческий мозг адаптирован под множественные связи и это аналоговый прибор, а компьютеры сейчас работают на архитектуре, которая изначально не создавалась под такие параллельные аналоговые вычисления. Компании сейчас работают над тем, чтобы развить технологию, индустрию, удешевить вычислители, то есть нас ждет больший рост вычислительной мощности для нейронных сетей, и количество перейдет в качество. Трудно гадать, сколько лет это займет, наверно 5-10, и мы получим искусственный разум, эквивалентный человеческому, и ему можно будет давать ему задачи, как работнику с высшим образованием.

– Не станет ли это проблемой для людей в связи с тем, что какие-то профессии станут невостребованными?

– Мы можем провести аналогию с тем, что происходило раньше. После индустриализации часть профессий была потеряна. Рынки меняются с появлением Uber, Яндекс такси, то есть происходит процесс отмирания старых специальностей и появления новых. Действительно, большой пласт интеллектуальной деятельности может передастся машинам. Вместе с тем будет развиваться рынок развлекательной индустрии и человеческого общения, культурный уровень возрастет. Нас, например, ожидает потеря большого рынка работы для водителей дальнобойных грузовиков, которые будут заменены на автоматическое вождение.

Есть такая теория технологической сингулярности, которая говорит о том, что развитие технологий развивается все быстрее и может достичь своей сингулярности, точки, когда развитие уйдет в бесконечность и за ней трудно что-то предсказывать. Как изменится общество, когда искусственный интеллект превзойдет людей, как мы будем чувствовать себя, когда спрашивать человека станет бессмысленно, и нужно будет спрашивать компьютер. Наверно, это можно прочувствовать тем, что уже сейчас люди могут сомневаться в диагнозе врача и гуглить свой диагноз в Интернете. Зачем они это делают? Они не доверяют человеку, но доверяют машине, поисковой системе. Вот так можно прочувствовать, как изменится мир в будущем.

– С одной стороны звучит прекрасно, но с другой – такое будущее немного пугает.

– Это позволит человечеству повысить эффективность труда, тем самым мы сможем меньше работать, больше самореализовываться. Современные технологии подарили нам сокращение трудового дня и трудовой недели, множество новых профессий. Поэтому прогресс явно увеличится с появлением сильного искусственного интеллекта, и это плюс. Но есть может быть какой-то пугающий минус. Например, мы можем сказать, в военном деле ИИ может стать опасной игрушкой, потому что он будет подчиняться людям. Плюсы и минусы есть, как и в любом деле, но откровенного страха в том, что человек теряет свою лидирующую позицию, я бы не испытывал. Мы потеряли ее в работе руками – используем бульдозеры, самосвалы и не переживаем по этому поводу.

– Но эти машины не имеют собственного интеллекта. – Да, но они физически сильнее человека. Человек слаб перед ними, он не может делать то, что делают они, он на вторых ролях. А тут мы получим вторые роли в мышлении, но при этом искусственный интеллект будет нам подчиняться, то есть тоже станет нашим инструментом. Мы переложим на него часть своих задач. Возможно, изменится кинематограф, можно будет превращать сценарии в фильмы, полностью сгенерированные на компьютере без актеров. Мы уже возрождаем или омолаживаем актеров с помощью технологии замены лиц. Это тоже сделано нейросетями. Так как это попало в индустрию, возможно, мы увидим умерших актеров в новых фильмах, если решат какие-то лицензионные вопросы. Это, возможно, сделает индустрию кино более доступной, появится больше идей, новый контент с помощью инструмента генерации. В целом я позитивно смотрю на развитие технологий.

– Где нейросети уже заменили человека?

– В области предсказания электропотребления, предсказания складских остатков, кредитного скоринга в банках, перевода. Думаю, много переводчиков потеряли работу после того, как появился Google Translate. Мы сами получаем письма на китайском, читаем и отвечаем на английском или пытаемся сделать обратный перевод на китайский. То есть теперь это больше не проблема: мы можем, не зная языка, общаться и не обращаться к переводчику. Наверно, полной замены никогда не будет, это всегда плавное отвоевывание рынка. Обработка фотографий все равно проводится на компьютере, но инструменты нейросетевой обработки ускорили эту работу. В социальных сетях есть бьюти-фильтры, где можно нажать кнопку и сделать фото лучше, не обращаясь к ретушеру.

– Как нейросети могут помочь в работе ученых?

– Я бы здесь провел такую аналогию: когда-то ученые не имели персональных компьютеров и работали с экспериментальными данными. А вся наука связана со сбором данных, анализом. Ученые пользовались миллиметровой бумагой, ставили точки, проводили графики, смотрели на них, перепечатывали их в свои работы. С появлением компьютера этот процесс сильно ускорился. Сейчас мы наблюдаем похожий процесс – с помощью ИИ можно делать другую автоматическую обработку данных, не привычную статистическую, которой обучают всех ученых, а ту, что сам человек объяснить, почему ИИ делает такие выводы, не сможет. Существуют задачи, которые искусственный интеллект решил, хотя люди даже не знали, что это возможно. Из недавнего – искусственный интеллект по рентгеновским снимкам грудной клетки способен предсказывать расу и пол человека. Люди не думали, что здесь есть, за что зацепиться, а ИИ комбинирует данные и находит эти взаимосвязи. И этот новый инструмент надо осваивать, чтобы решать задачи, которые без этого инструмента решать слишком долго и поэтому люди за них не берутся. Это просто новый класс задач и ускорение старых задач, в чем заключается основной плюс для исследователя. Поэтому если хочешь расширять научную область, осваивай новые инструменты – нейросети и, в более широком понимании, ИИ.

«Курсов, которые ставят целью применение в науке, больше нет»

 

– Давайте тогда поговорим про курс «Нейронные сети и их применение в научных исследованиях». Кому он подойдет?

– Этот курс для тех, кто находится на пороге своих научных работ либо уже писал научные работы и готов изучать новое. На курсе мы не просто рассказываем об инструменте, мы учим, переходя плавно к выполнению научной работы, поэтому если кто-то не знает, что он собирается исследовать, у него нет темы и он хочет пройти наш курс, то у него не получится выполнить вторую часть, потому что тему исследования человек все-таки должен принести с собой. Но если кто-то понимает, что он хочет сделать, пусть даже не зная, как применить искусственный интеллект, он может обратиться к нам, мы поможем, если увидим, что на нашем курсе есть смысл учиться.

– Какими базовыми знаниями нужно обладать, чтобы курс не показался сложным?

– Необходимо быть начинающим программистом. Есть люди, которые совсем не соприкасаются с базовым программированием. Им нам тяжелее всего помочь, потому что если человек даже не пробовал, то наверно у него не получится. Это является большим входным барьером в основном для гуманитарных факультетов, где отношение к теории вероятности, математическому анализу, который тоже преподается, часто бывает, как к второстепенным предметам. Мы стараемся проводить дополнительное обучение перед началом курса, но 6 полных дней недостаточно, чтобы вытянуть из полного незнания. Думаю, сейчас тема IT довольно популярна, и ребята поймут, что изучение базового программирования, даже если оно в жизни потом может не пригодится, это та область, которую надо понимать в современном мире. А также базовые понятия теории вероятности и математической статистики, но они не ключевые. Без них возможно где-то будет тяжело, но самое главное – программирование, то есть умение разговаривать с компьютером на языке заданий.

– Это касается всех специальностей в МГУ?

– Да, наш курс рассчитан на все факультеты, и сейчас к нам приходят люди из разных факультетов, но часто приходят с кафедр, где сильно развита математика, а другие кафедры мы не можем охватить. Ребята, которые обманным путем попадают к нам, пройдя вступительный барьер, отваливаются, не могут потянуть сложность. Для того барьер и введен, чтобы отсеять того, кто все равно не потянет. Мы уже охватываем много факультетов, но мало можем охватить из этих факультетов гуманитариев из-за нехватки знаний в программировании.

– Что изучается на курсе?

– По сути, классическое машинное обучение как вводная часть и основные технологии в нейронных сетях без самых современных (из-за ограниченной длительности курса). То есть курс не про самые современные достижения. Они сложны в применении. Курс про те инструменты, которые появились 3 и более лет назад и зарекомендовали себя. То, что появилось год назад, бывает слишком сырое и поэтому если изучать этот инструмент, то человек, пришедший с базовым уровнем программирования, просто не осилит это. Это как биткоин: в 2009 году его могли запускать только отчаянные программисты, а сейчас можно кликать и что-то куда переводить криптовалюту со смартфона. Просто этого не было тогда, когда биткоин появился, тоже самое касается новых инструментов. Мы учим применять, понимать, использовать правильно. Тем, кто занимается улучшением технологии нейронных сетей, например, с ВМК МГУ, на нашем курсе будет откровенно скучно, потому что они наверняка все знают. Курс для них бесполезен за исключением того, что наши преподаватели обладают экспертизой и могут подсказать что-то, что молодой исследователь еще не знает.

 

– Как строятся практические занятия?

– Занятие теоретическое и практическое объединено в единый день. На каждом занятии есть список заданий и балльная система по их выполнению. Лучшим студентам полагается стипендия по результатам начисленных баллов. Два раза в семестр мы пересматриваем список лучших и перераспределяем стипендию, чтобы появился дополнительный стимул стараться максимально все сделать в аудитории. То, что человек не доделал во время занятия, он может сделать дома и получить половинчатый балл за самостоятельно выполнение. На курсе мы оцениваем умение и мотивацию. Умение – это сколько сделал в классе, мотивация – это решил ли доделывать за полцены дома сам.

– Предусмотрен ли отбор для желающих обучаться на курсе?

– Да, отбор как раз связан с тем, что нужно знать язык программирования Python на базовом уровне. Мы делаем конкурс в интернете, похожий на олимпиадное программирование. Конкурсантам нужно написать программу, которая обработает определенные данные или даст ответ, то есть выполнить задания. Они проверяются автоматически компьютером и баллы начисляются за совпадение того, что программа посчитала правильным ответом с заранее известным правильным ответом. К сожалению, если человек почти правильно решил задачу, у него были правильные мысли, но ответ неверный, он не получает ничего за эту задачу. То есть здесь нужно только правильное решение, но мы делаем задачи без подвоха. Мы проверяем, способен ли человек написать основной алгоритм решения задачи без ошибок. Пусть он не имеет опыта во всяких нюансах, но он хотя бы знает один правильный путь. Это не единственное испытание, есть еще анкета. И многие не понимают, что мы отказываем людям, которые прекрасно прошли вступительное испытание, но у которых по анкетным данным видно, что они зря к нам идут.

– Что нужно указать в анкете?

– Нам важно понимание человека: чем он собирается заниматься у нас на курсе с точки зрения написания научной работы. Проблемы могут быть следующие: непонимание, что он собирается исследовать, и тут мы даже не можем помочь, или описывает в анкете работу, которую невозможно решить нейросетями. «Веревкой Луну к Земле привязать и будем по ней забираться» – вот такая работа. В хорошей анкете человек провел самостоятельную работу по анализу научной области. Это то, что должен делать исследователь: он посмотрел аналогичные работы, обсудил со своим научным коллективом, примерно описал, как будет подходить к выполнению своей задачи. На данный момент мы можем приглашать к учебе магистров, аспирантов, выпускников МГУ, которые проходят аспирантуру в других вузах и сотрудников МГУ всех факультетов.

 

– После курсов они получают сертификат? Что становится результатом прохождения курсов кроме, очевидно, полученных знаний?

– Аспирантам курс засчитывается как аспирантский пройденный курс, магистрам некоторых факультетов – как факультатив, сотрудникам мы не можем его зачесть. Есть две вещи, которые слушатели получают в конце – знания и деньги. Знания мы стараемся передать человеку во время учебы, а в конце обучения проводим конкурс. Смотрим практически готовый текст к публикации и даем время, чтобы человек смог опубликовать свою работу. Далее сравниваем опубликованные работы по рейтингу журналов. Есть правила, по которым комиссия выносит свои балл, лучшим в рейтинге выплачивается денежный приз. В этом году авторы пяти лучших работ получили по 200 тысяч рублей. Итогом для всех слушателей курса становятся знания и возможность получить этот приз.

– В чем преимущество курса и чем он отличается от других, если такие есть?

– В науке мало денег, в основном они сосредоточены в индустрии, поэтому там курсов много. Насколько я знаю, курсов, которые ставят целью применение в науке, больше нет. Это отличия нашего курса. Еще одно важное свойство – это практикум. У нас есть два семестра: в первом семестре треть отводится теоретической работе, две трети- практической на занятии. Занятия очные, потому что мы хотим, чтобы ученик, если у него возникают сбои в его программе, компьютер жалуется и не работает так, как он хочет, максимально быстро получил помощь от преподавателя, чтобы они посмотрели в один монитор, ему бы прямо здесь и сейчас подсказали, как лучше сделать.

Мы выпускаем людей, которые должны стать самостоятельными исследователями в мире, уметь писать программы, использующие нейронные сети, а то, что они не знают, легко доизучить самостоятельно, потому что у них есть фундамент знаний, они теперь понимают эту терминологию. Без фундамента тяжело даже начинать, потому что ты не понимаешь слов, которыми тебе доносят смысл. Обучение длится год по той причине, что во втором семестре надо пройти большую научную работу, она отличается от маленьких тем, что в маленьких ты только пробуешь инструменты ИИ, а в больших ты погружаешься на уровень ниже, где еще не бывал.

Многие мечтают что-то сделать, дают себе обещание прочитать книгу летом. Книга читается тяжело, встречаются какие-то вопросы, а рядом того, кто бы смог ответить на них нет, в итоге книгу бросаешь. Это подрывает веру в свои силы, а если прийти к нам, то появится человек, работа которого помогать. Мы берем таких людей и за руку поднимаем на тот фундамент знаний, с которого они дальше пойдут сами.

Еще больше информации о курсе вы можете найти на сайте и в группе Нейронные сети и наука МГУ имени М.В. Ломоносова ВКонтакте.