Аспирантка факультета биоинженерии и биоинформатики МГУ им. М.В. Ломоносова Анна Сопленкова занимается изучением генетического контроля N-гликозилирования иммуноглобулина G с помощью методов машинного обучения. Победительница конкурса грантовой поддержки молодых ученых фонда «Интеллект» рассказала о своем исследовании.
— Анна, расскажите о своем исследовании «Изучение генетического контроля N-гликозилирования иммуноглобулина G с помощью методов машинного обучения».
—Тема моего исследования находится на пересечении двух наук — генетики и гликомики. С генетикой я познакомилась во время написания диплома на последнем курсе механико-математического факультета МГУ, прослушивая онлайн-курс лекций д.б.н. Ю.С. Аульченко по количественной генетике. Генетика показалась мне очень интересным направлением, и я решила посвятить свою дальнейшую научную деятельность этой области, поступив в аспирантуру ФББ. Гликомика, в свою очередь, — это подраздел гликобиологии — науки, которая изучает достаточно сложный процесс присоединения углеводного остатка (гликана) к белку или липиду. Гликозилирование начали активно изучать сравнительно недавно, но оказалось, что его влияние на организм очень велико. Меня вдохновляет возможность узнавать об устройстве нашего организма чуть больше, чем это было известно ранее.
— Какая цель вашего исследования?
—Моя цель — узнать, какие гены регулируют сложный процесс гликозилирования белка иммуноглобулина G, это позволит пролить свет на то, как гликаны вовлечены в контроль мультифакторных заболеваний человека, а также разработать новые биомаркеры для гликом-ассоциированных заболеваний. Для того чтобы это сделать, мне нужно, во-первых, разработать инструмент для восстановления уровней представленности N-гликанов иммуноглобулина G по уровням представленности N-гликанов всех белков плазмы крови человека вместе. И, затем, провести крупнейшее в мире исследование по поиску генетических ассоциаций N-гликозилирования иммуноглобулина G.
слева изображен белок без гликанов, справа — с гликанами.
—Что такое N-гликаны и как они связаны с иммуноглобулином G?
— Более 50% белков плазмы крови человека содержат N-гликаны (олигосахаридные цепи, присоединенные к атому азота остатков аспарагина) в своем составе. Гликозилирование — это биохимический процесс, в ходе которого гликаны присоединяются к белкам или липидам. Эта модификация влияет как на физико-химические свойства белков, так и на их биологическую роль. Изучать белки без гликанов — все равно, что изучать птицу без перьев: мы поймем ее физиологию и анатомию, но никогда не увидим, как она летает.
Антитело иммуноглобулин G (IgG) — один из наиболее распространенных гликопротеинов плазмы крови человека. IgG состоит из Fab и Fc фрагментов, оба из которых подвергаются гликозилированию. Гликан в составе Fab фрагмента IgG влияет на взаимодействие антитела с антигеном, тогда как гликан в составе Fc фрагмента IgG может модулировать иммунный ответ — от провоспалительного до противовоспалительного и наоборот.
— В чем практическая польза вашего исследования?
— В настоящее время понимание генетических механизмов регуляции N-гликозилирования ограничено. Известна ассоциация гликанов с множеством мультифакторных заболеваний человека, таких как диабет 1 и 2 типа, ревматоидный артрит, болезнь Паркинсона, дорсалгия, гипертензия и другие. Понимание генетических механизмов N-гликозилирования, на что и направлена наша работа, необходимо для поиска новых биомаркеров и терапевтических мишеней для гликом-ассоциированных заболеваний.
В самом распространенном методе исследования генетического контроля — полногеномном исследовании ассоциаций — определяющую роль часто играет размер выборки. Измерение профиля N-гликозилирования для новых образцов является трудоемким, длительным и дорогостоящим процессом. Наша работа позволит увеличить размер выборки для исследований генетического контроля N-гликозилирования иммуноглобулина G без необходимости профилирования новых образцов.
— Как машинное обучение помогает решить вашу задачу?
— Первая часть исследования направлена на восстановление концентраций N-гликанов иммуноглобулина G, зная концентрации N-гликанов смеси белков плазмы крови человека. Для восстановления концентраций иммуноглобулина G можно использовать различные подходы — от линейной регрессии до методов машинного обучения. В настоящее время я работаю с различными моделями, выбирая оптимальную для нашей задачи. Кроме того, машинное обучение активно внедряется в исследования генетических ассоциаций: с помощью ИИ можно приоритизировать гены внутри участков генома, ассоциированных с тем или иным признаком.