Table of Contents

Программа

01.05.2025

Внимание! В данный список включены заявленные доклады, включенные в программу конференции.

Если кто-то не нашел себя в списке, просьба сообщить по почте dlcp@sinp.msu.ru

Section 1. Machine Learning in Fundamental Physics

36. Реконструкция энергии космических лучей ультравысоких энергий, зарегистрированных флуоресцентным телескопом: одного такта времени может быть достаточно

М.Ю. Зотов (1), А.А. Трусов (2)
(1) НИИЯФ МГУ, (2) Физический факультет МГУ

Мы рассматриваем задачу реконструкции энергии космических лучей (КЛ) ультравысоких энергий по данным флуоресцентного телескопа EUSO-TA. Данные были собраны в 2015 г. на сайте эксперимента Telescope Array (ТА). EUSO-TA – это небольшой телескоп-рефрактор с диаметром линз 1 м, полем зрения 10х10 градусов и временным разрешением 2.5 мкс, созданный для наземных тестов аппаратуры, создаваемой в рамках научной программы коллаборации JEM-EUSO. Основные трудности реконструкции энергии возникают вследствие маленького поля зрения (в 30 раз меньше, чем у флуоресцентных телескопов ТА) и низкого временного разрешения (в 25 раз ниже, чем у ТА). Это приводит к тому, что EUSO-TA способен регистрировать лишь часть треков широких атмосферных ливней, и весь сигнал оказывается, как правило, записан в течение всего одного такта времени. Мы покажем, что ансамбль свёрточных нейронных сетей позволяет даже в таких условиях оценить энергию первичных КЛ с приемлемой точностью.

Section 2. Machine Learning for Environmental Sciences

15. Восстановление приповерхностной влажности атмосферы над океаном с применением методов машинного обучения

С. А. Вострикова (1), М. А. Криницкий (1,2), С. К. Гулёв (2), М. П. Александрова (2)
(1) Московский физико-технический институт, (2) Институт океанологии им. П. П. Ширшова РАН

Влажность воздуха в приповерхностном слое атмосферы над океаном является ключевым климатическим параметром, влияющим на процессы переноса влаги и тепла между океаном и атмосферой, а также на динамику атмосферных процессов в целом. Международный массив данных о характеристиках океана и атмосферы (ICOADS) указывает на недостаточную плотность измерений влажности в начале XX века по сравнению с более поздними периодами, что создает сложности для адекватного анализа климатических тенденций относительной влажности. Представленные в литературе методы восстановления временных рядов влажности зачастую демонстрируют ограниченную точность, основываясь преимущественно на статистических и эвристических подходах. Наша работа направлена на повышение качества решения этой задачи за счёт применения методов машинного обучения. В настоящей работе решена задача в формулировке аппроксимации моментальных значений относительной влажности по данным сопутствующих измерений атмосферного давления, температуры воздуха, скорости и направления ветра, температуры поверхности океана, а также наблюдений количества и типов облачности на трёх ярусах. Кроме этого, в составе сопутствующих переменных используется код погоды по стандарту ВМО и расчетная высота солнца. В исследовании использованы модели машинного обучения следующих типов: линейная регрессия, случайный лес, градиентный бустинг (CatBoost) и полносвязная искусственная нейронная сеть. Для повышения территориальной и временной специфичности разрабатываемых моделей мы провели исследование для каждой ячейки размером 5 градусов по широте и долготе и каждого сезона по отдельности. На основе полученных результатов были построены карты пространственного распределения ошибок моделей, которые позволили выявить регионы с высокой и низкой точностью аппроксимации влажности. Исследование подтвердило эффективность методов машинного обучения для восстановления климатических рядов, определило наиболее подходящие модели для этой задачи и обозначило перспективные направления для дальнейшей работы.

16. Сравнение моделей машинного обучения в задаче идентификации аномалий в данных визуальной съемки поверхности моря

Белоусова О.(1,2), Криницкий М.А.(1,2)
(1) Московский физико-технический институт, (2) Институт океанологии им. П.П. Ширшова РАН

Обнаружение морского макромусора является важной задачей для защиты экосистем океана, поскольку загрязнение угрожает биологическому разнообразию и здоровью водных ресурсов. Однако сложность задачи заключается в большом разнообразии объектов, их малых размерах, частичном погружении под воду и слиянии с окружающей средой, что делает обнаружение затруднительным. В настоящей работе мы проводим сравнительный анализ современных методов нахождения морского макромусора на примере двух подходов. В первом из них проведена детекция объектов на цельных фотоснимках с помощью нейронной сети YOLO. Во втором подходе осуществлены поиск аномалий на отдельных фрагментах фотоснимков с помощью свёрточной нейронной сети ResNet50, обученной по методу Momentum Contrast (MoCo), а затем их классификация с помощью градиентного бустинга CatBoost. Особенностями предлагаемого во втором подходе алгоритма обучения стали разные способы сэмплирования фрагментов изображений поверхности моря, необходимых для контрастного самоконтролируемого обучения, и использование различных функций потерь. Качество обучения оценивалось с помощью метрики F1-Score в задаче распознавания объектов трёх типов: плавающий морской мусор, птицы и блики на камере.

Section 3. Machine Learning in Natural Sciences

37. Neutron spectrum unfolding with deep learning models for tabular data

Chizhov Konstantin Alekseevich (1,2), Bely Artyom Alekseevich (2)
(1) Joint Institute for Nuclear Research, Laboratory of Information Technologies named after. M.G. Meshcheryakov, (2) University “Dubna”

Estimation of the effective dose and unfolding the spectrum of neutron radiation at nuclear power facilities and charged particle accelerators is complicated by the lack of direct methods for detecting neutrons and the need to register secondary particles. The main difficulties are related to the wide energy range of neutrons from 1 meV to several hundred MeV, complex dependence of the neutron interaction cross section on energy. One of the main devices used for neutron spectrometry is the Bonner multi-sphere spectrometer (BSS). The measurement results and the desired spectrum, discretized on the energy grid (or decomposed into basis functions) are tabular data. However, due to the limited set of moderator spheres and correlations in its response functions, the number of input features is limited. In this paper, it is proposed to transform the original scalar continuous features into vectors. And then unfold the spectra for the transformed features using deep learning models included in the Mambular framework: a sequential model from Mamba architecture blocks based on autoregressive state-space models; a model using transform encoders (FT-Transformer), a multilayer perceptron (MLP) model, and batch ensembling for MLP (TabM). The results are compared with the spectra unfolded using the automated machine learning (AutoML) framework implementing an ensemble of linear and decision-tree based (LightGBM, CatBoost, and Random Forest) regression models. For training and validation of the models, a set of 5×10⁵ synthetic spectra was generated, modeled as a superposition of four weighted components describing the spectra of thermal, epithermal, fast, and high-energy neutrons. A comparison was made with calculated and measured spectra from the IAEA compendium database, 251 spectra. The uncertainty of the spectra unfolding was estimated using the Monte Carlo method, in which random perturbations were introduced into the input data. The model was trained on the JINR Multifunctional Information and Computing Complex.

The research was carried out within the framework of the state assignment of the Ministry of Science and Higher Education of the Russian Federation (topic No. 124112200072-2).