Магистрант физического факультета МГУ Дмитрий Сальников прошел курс и стал одним из победителей конкурса публикаций 7-го потока курса «Нейронные сети и их применение в научных исследованиях». Его статья «Application of Neural Networks for Calculating Functional Integrals in Quantum Field Theory» опубликована в журнале Physics of Particles and Nuclei.

Для классического объекта, например для мяча, мы можем в любой момент времени точно определить положение, скорость, направление движения и вращение. Но для квантовой частицы, например электрона в атоме, это невозможно. Мы можем говорить только о распределениях вероятностей ее положения и скорости, но не о точных значениях.
Один из способов описания движения квантовой частицы — это метод континуального интеграла или интеграла по траекториям (от английского, path integral). В этой модели вероятность того, что частица переместится из одной точки в другую за определенное время, вычисляется как сумма вероятностей по всем возможным траекториям, связывающим эти точки.
Траектории, близкие к классической, оказываются наиболее вероятными. Например, для свободной частицы классическая траектория — это прямая линия между двумя точками. Классическая частица движется строго по ней, а квантовая — в среднем по этой прямой, но может от нее отклоняться.
Если известна вероятность каждой возможной траектории, можно рассчитать средние значения и отклонения любых характеристик движения. Такие расчеты называются интегралом по траекториям.
Точные аналитические вычисления континуальных интегралов возможны лишь для очень простых теорий. В более сложных случаях это сделать невозможно, поэтому используют численные методы.
Суть этих методов в том, что непрерывное время разбивается на короткие шаги, а траектория частицы описывается как последовательность ее положений в каждый момент времени. Тогда вероятность реализации конкретной траектории сводится к совместной плотности вероятности большого набора случайных величин. Чтобы найти средние значения, приходится генерировать множество таких траекторий из сложного многомерного распределения.
Для этого существуют статистические численные методы. Они работают, но требуют огромных вычислительных ресурсов, что становится серьезным ограничением: при сложных задачах достичь нужной точности не всегда удается.
Альтернативный подход состоит в том, чтобы построить отображение, которое преобразует выборки из простых распределений случайных величин в нужные. Его главное преимущество в том, что достаточно лишь найти такое отображение, то есть построить модель. После этого увеличение числа выборок не потребует дополнительных ресурсов.
В качестве отображения рассматривалась модель машинного обучения с архитектурой нормализующих потоков (англ. Normalizing Flow). Эта архитектура обладает необходимыми для искомого отображения свойствами и позволяет относительно просто вычислять функцию потерь, необходимую для обучения.
«Построенная на данный момент модель пока не позволяет точно генерировать выборки из целевого распределения из-за большого числа случайных величин в траектории и сложной зависимости между ними. Тем не менее она уже может использоваться для ускорения вычислений в сочетании с существующими алгоритмами. Если в качестве исходных траекторий для этих алгоритмов использовать траектории, сгенерированные моделью, сходимость к целевому распределению может быть ускорена в несколько раз по сравнению со случайными начальными траекториями. Улучшение качества генерации отображения и ускорение вычислений для более сложных физических моделей позволит в дальнейшем проводить расчеты в рамках актуальных задач квантовой теории», — уточнил молодой ученый.
Исследование выполнено при поддержке некоммерческого фонда развития науки и образования «Интеллект» и Фонда «Вольное Дело» Олега Дерипаска