User Tools

Site Tools


dlcp2025:program

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
dlcp2025:program [20/06/2025 18:57] – [81. Проблема аугментация данных атмосферных черенковских телескопов в стерео режиме на примере установки TAIGA-IACT] admindlcp2025:program [27/06/2025 20:35] (current) – [Program] admin
Line 1: Line 1:
 {{ :dlcp2025:dlcp25-logo.png?200|}} {{ :dlcp2025:dlcp25-logo.png?200|}}
  
-====== Program (DFAFT) ======+====== Program ======
 //17.06.2025// //17.06.2025//
  
 **The list of accepted reports.** **The list of accepted reports.**
  
-<color /orange>Please note that the first author should be the presenter.</color>+<color /orange>The first author is the presenter.</color>
  
 //If someone did not find themselves in the list, please inform us by email [[dlcp@sinp.msu.ru]]// //If someone did not find themselves in the list, please inform us by email [[dlcp@sinp.msu.ru]]//
Line 97: Line 97:
 ==== 81. Проблема аугментация данных атмосферных черенковских телескопов в стерео режиме на примере установки TAIGA-IACT ==== ==== 81. Проблема аугментация данных атмосферных черенковских телескопов в стерео режиме на примере установки TAIGA-IACT ====
  
-//Д.Журов(1,3), А.Крюков(1), Ю.Дубенская(1), E. Gres(1,3); С.Поляков(3), ЕюПостников(1), А.Разумов(1), П.Волчугов(1), А.Демичев(1) \\ +//**Д.Журов**(1,3), А.Крюков(1), Ю.Дубенская(1), E. Gres(1,3); С.Поляков(3), ЕюПостников(1), А.Разумов(1), П.Волчугов(1), А.Демичев(1) \\ 
 (1) SINP MSU, (2) IIAP NAS RA, (3) IPA IGU // (1) SINP MSU, (2) IIAP NAS RA, (3) IPA IGU //
  
Line 106: Line 106:
  
 Работа выполнена при финансовой поддержке Российского научного Фонда, грант 24-11-00136. Работа выполнена при финансовой поддержке Российского научного Фонда, грант 24-11-00136.
- 
-Application of Normalizing Flows for Detecting Rare Events in Gamma-Ray Astronomy 
- 
-Studying the fluxes of gamma quanta (gamma rays) of various energies generated in the vicinity of galactic and metagalactic sources is one of the most promising ways to study the sources themselves, and hence the important processes occurring in the Universe. The fact is that charged cosmic rays (elementary particles and atomic nuclei) are significantly influenced by galactic and intergalactic magnetic fields, which leads to a strong distortion of their trajectories and, as a result, to the loss of any information about the place of their origin. Gamma-ray astronomy does not have these shortcomings, since photons trajectories are not distorted because of their electric neutrality and therefore indicate the direction of their origin. In many ways, these reasons have contributed in recent years to the rapid development of experimental gamma-ray astronomy in the world, see, e.g., [1,2] and references therein. 
-An important fact that must be taken into account is that the flux of gamma rays is very small compared to the flux of cosmic rays (electrically charged particles), the ratio is not higher than 1:1000. Because of the large background its is crucial that the methods for classification of the recorded events perform well. For this aim new algorithms are explored to enhance the separation of gamma rays and charged cosmic rays including those based on deep learning [2]. In this work we suggest a new method for detecting rare gamma quanta against the background by heavily using normalizing flow-based deep learning models. The latter are generative models that explicitly models a probability distribution by leveraging normalizing flow, which is a statistical method using the change-of-variable law of probabilities to transform a simple distribution into a complex one (see, e.g., [3] and refs therein). We consider various versions of the method based both on one-class and two-class learning (classification). Moreover in the former case there exist the possibilities to choose as the training class both gamma quanta and the charged particles. The method is intended to be applied for processing the experimental data of the TAIGA (Tunka Advanced Instrument for Gamma Astronomy and Cosmic-Ray Physics) project [4]. 
- 
-The work was carried out with financial support from the Russian Science Foundation, grant No. 24-11-00136 
- 
-[1] Sitarek, Julian. “TeV instrumentation: current and future.Galaxies 10, no. 1 (2022) 21. \\  
-[2] Demichev, Andrey, and Alexandr Kryukov. “Using deep learning methods for IACT data analysis in gamma-ray astronomy: A review.”Astronomy and Computing 46 (2024) 100793. \\  
-[3] Kobyzev, Ivan, Simon JD Prince, and Marcus A. Brubaker. “Normalizing flows: An introduction and review of current methods.”IEEE transactions on pattern analysis and machine intelligence 43, no. 11 (2020) 3964-3979. \\  
-[4] N. Budnev et al., “TAIGA—A hybrid array for high-energy gamma astronomy and cosmic-ray physics”, Nuclear Instruments and Methods in Physics Research, A958 (2020) 162113 
  
 ==== 42. Возможность применения метода нормализующих потоков для извлечения редких гамма событий в эксперименте TAIGA ==== ==== 42. Возможность применения метода нормализующих потоков для извлечения редких гамма событий в эксперименте TAIGA ====
  
-//А.Крюков(1), А.Разумов(1), Д.Журов(1,3), Ю.Дубенская(1), E. Gres(1,3); С.Поляков(3), Е.Постников(1), П.Волчугов(1), А.Демичев(1) \\ +//**А.Крюков**(1), А.Разумов(1), Д.Журов(1,3), Ю.Дубенская(1), E. Gres(1,3); С.Поляков(3), Е.Постников(1), П.Волчугов(1), А.Демичев(1) \\ 
 (1) SINP MSU, (2) IIAP NAS RA, (3) IPA IGU // (1) SINP MSU, (2) IIAP NAS RA, (3) IPA IGU //
  
Line 127: Line 115:
  
 Работа выполнена при финансовой поддержке Российского научного фонда, грант № 24-11-00136 Работа выполнена при финансовой поддержке Российского научного фонда, грант № 24-11-00136
 +
 +==== 95. Гамма-астрономия ультравысоких энергий и проект TAIGA-100 ====
 +
 +//**L.Kuzmichev**, SINP MSU//
  
 ---- ----
Line 212: Line 204:
 ==== 89. Восстановление высоты зданий с использованием машинного обучения и цифровой модели поверхности ArcticDEM ==== ==== 89. Восстановление высоты зданий с использованием машинного обучения и цифровой модели поверхности ArcticDEM ====
  
-//**Самсонов Тимофей Евгеньевич** (1,2), Варенцов Михаил Иванович (1,2) \\ (1) Московский государственный университет имени М.В. Ломоносова, (2) ФГБУ «Гидрометцентр России»//+//**Окунева Влада Викторовна**(1), Самсонов Тимофей Евгеньевич(1,2), Варенцов Михаил Иванович (1,2) \\ (1) Московский государственный университет имени М.В. Ломоносова, (2) ФГБУ «Гидрометцентр России»//
  
 Моделирование погоды и климата для урбанизированных территорий требует детального описания городской подстилающей поверхности. Стремительное преобразование городской среды требует регулярного обновления необходимых для расчета данных. Несмотря на появление все большего количества моделей городского климата в разных масштабах, на данный момент все еще отсутствует полный, глобальный и согласованный набор пространственных данных, характеризующих релевантные свойства городской застройки. Существующие сейчас продукты, показывают, что разнообразие параметров и неоднородность городской среды в разных частях мира осложняют создание такого набора данных. Именно поэтому важна интеграция существующих наборов данных и усовершенствование уже существующих баз, путем дополнения необходимых атрибутивных характеристик и заполнения недостающих данных. Целью исследования является восстановление высотности зданий, одного из ключевых геометрических параметров городской среды, на основе разнообразных источников с использованием машинного обучения. Работа выполнена на примере города Санкт-Петербурга. В работе используется новая векторная база пространственных данных Overture Maps, уникальностью которой является интеграция нескольких источников данных (OpenStreetMap, Microsoft Buildings, Google Open Buildings), регулярный выпуск обновлений и стандартизированная структура хранения данных. Несмотря на существенные достоинства, проблемой остается отсутствие данных о высоте и этажности для значительной доли зданий, особенно для территории России. На решение этой проблемы направлено наше исследование. В качестве предикторов для восстановления этажности использован набор морфометрических признаков соответствующих зданиям полигонов: его площадь, его компактность, пропорции минимального по площади ограничивающего прямоугольника и отношение площади здания к площади этого прямоугольника. Кроме того, были использованы характеристики окружающей территории, а именно локальные климатические зоны (ЛКЗ) из базы данных WUDAPT, которые являются уникальными регионами с однородными по структуре, покрову и материалом поверхности. В качестве дополнительных характеристик также были использованы назначение здания и его класс из базы данных Overture Maps. Модель восстановления этажности реализована методом регрессионных деревьев с применением градиентного бустинга. Техническая реализация выполнена с помощью библиотеки CatBoost. Кроме того, исследована использование в качестве дополнительного предиктора оценки высоты здания цифровая модель поверхности (ЦМП) высокого разрешения. В качестве последней использована ЦМП ArcticDEM с разрешением в 2 м и покрывающая территорию севернее 60 градусов с.ш. На основе информации о дорожной сети, хранящейся в Overture Maps, была создана цифровая модель рельефа (ЦМР), характеризующая высоту поверхности без учета зданий и деревьев. Путем нахождения разности исходного набора данных и рассчитанной ЦМР были получены оценки высоты зданий, которые использовались в качестве одного из признаков в модели машинного обучения. Обучение модели проводилось как на уровне всей территории Санкт-Петербурга, так и отдельно для разных типов ЛКЗ. Такой подход позволил оценить влияние морфологических особенностей территории на качество предсказаний и значимость признаков. В ходе обучения на тренировочных выборках модель демонстрировала высокую точность и достигала значений 0,94, что указывает на хорошее согласование модели с исходными данными. На валидационных выборках точность была ниже и варьировалась от 0,68 до 0,79. Анализ важности признаков в построении модели показал, что их значимость существенно меняется в зависимости от типа ЛКЗ. Это подтверждает наличие выраженных морфологических особенностей в пределах конкретной зоны и подчеркивает необходимость индивидуального подхода к построению модели для различных территорий. Так, для ЛКЗ 10, соответствующей промышленными территориям, ключевым оказался высота, полученная по ArcticDEM, а для открытой малоэтажной застройки (ЛКЗ 6) – класс здания. Сравнение моделей, обученных на разных масштабах (в пределах городских районов и всего города), также выявило различия в распределении признаков. Это указывает на влияние масштаба анализа на итоговый результат и точность модели. Таким образом, модель градиентного бустинга на основе данных из базы данных Overture Maps продемонстрировала высокую эффективность при восстановлении высот зданий, имеющих различные характеристики. В дальнейшем повышение точности модели предполагается путем расширения используемых признаков и внедрения новых источников данных.  Моделирование погоды и климата для урбанизированных территорий требует детального описания городской подстилающей поверхности. Стремительное преобразование городской среды требует регулярного обновления необходимых для расчета данных. Несмотря на появление все большего количества моделей городского климата в разных масштабах, на данный момент все еще отсутствует полный, глобальный и согласованный набор пространственных данных, характеризующих релевантные свойства городской застройки. Существующие сейчас продукты, показывают, что разнообразие параметров и неоднородность городской среды в разных частях мира осложняют создание такого набора данных. Именно поэтому важна интеграция существующих наборов данных и усовершенствование уже существующих баз, путем дополнения необходимых атрибутивных характеристик и заполнения недостающих данных. Целью исследования является восстановление высотности зданий, одного из ключевых геометрических параметров городской среды, на основе разнообразных источников с использованием машинного обучения. Работа выполнена на примере города Санкт-Петербурга. В работе используется новая векторная база пространственных данных Overture Maps, уникальностью которой является интеграция нескольких источников данных (OpenStreetMap, Microsoft Buildings, Google Open Buildings), регулярный выпуск обновлений и стандартизированная структура хранения данных. Несмотря на существенные достоинства, проблемой остается отсутствие данных о высоте и этажности для значительной доли зданий, особенно для территории России. На решение этой проблемы направлено наше исследование. В качестве предикторов для восстановления этажности использован набор морфометрических признаков соответствующих зданиям полигонов: его площадь, его компактность, пропорции минимального по площади ограничивающего прямоугольника и отношение площади здания к площади этого прямоугольника. Кроме того, были использованы характеристики окружающей территории, а именно локальные климатические зоны (ЛКЗ) из базы данных WUDAPT, которые являются уникальными регионами с однородными по структуре, покрову и материалом поверхности. В качестве дополнительных характеристик также были использованы назначение здания и его класс из базы данных Overture Maps. Модель восстановления этажности реализована методом регрессионных деревьев с применением градиентного бустинга. Техническая реализация выполнена с помощью библиотеки CatBoost. Кроме того, исследована использование в качестве дополнительного предиктора оценки высоты здания цифровая модель поверхности (ЦМП) высокого разрешения. В качестве последней использована ЦМП ArcticDEM с разрешением в 2 м и покрывающая территорию севернее 60 градусов с.ш. На основе информации о дорожной сети, хранящейся в Overture Maps, была создана цифровая модель рельефа (ЦМР), характеризующая высоту поверхности без учета зданий и деревьев. Путем нахождения разности исходного набора данных и рассчитанной ЦМР были получены оценки высоты зданий, которые использовались в качестве одного из признаков в модели машинного обучения. Обучение модели проводилось как на уровне всей территории Санкт-Петербурга, так и отдельно для разных типов ЛКЗ. Такой подход позволил оценить влияние морфологических особенностей территории на качество предсказаний и значимость признаков. В ходе обучения на тренировочных выборках модель демонстрировала высокую точность и достигала значений 0,94, что указывает на хорошее согласование модели с исходными данными. На валидационных выборках точность была ниже и варьировалась от 0,68 до 0,79. Анализ важности признаков в построении модели показал, что их значимость существенно меняется в зависимости от типа ЛКЗ. Это подтверждает наличие выраженных морфологических особенностей в пределах конкретной зоны и подчеркивает необходимость индивидуального подхода к построению модели для различных территорий. Так, для ЛКЗ 10, соответствующей промышленными территориям, ключевым оказался высота, полученная по ArcticDEM, а для открытой малоэтажной застройки (ЛКЗ 6) – класс здания. Сравнение моделей, обученных на разных масштабах (в пределах городских районов и всего города), также выявило различия в распределении признаков. Это указывает на влияние масштаба анализа на итоговый результат и точность модели. Таким образом, модель градиентного бустинга на основе данных из базы данных Overture Maps продемонстрировала высокую эффективность при восстановлении высот зданий, имеющих различные характеристики. В дальнейшем повышение точности модели предполагается путем расширения используемых признаков и внедрения новых источников данных. 
Line 232: Line 224:
 [3] World Data Center for Geomagnetism, Kyoto [[https://wdc.kugi.kyoto-u.ac.jp/]] \\  [3] World Data Center for Geomagnetism, Kyoto [[https://wdc.kugi.kyoto-u.ac.jp/]] \\ 
 [4] National Oceanic and Atmospheric Administration, ACE Real Time Solar Wind, [[https://www.swpc.noaa.gov/products/ace-real-time-solar-wind ]] [4] National Oceanic and Atmospheric Administration, ACE Real Time Solar Wind, [[https://www.swpc.noaa.gov/products/ace-real-time-solar-wind ]]
 +
 +==== 96. Машинное обучение для статистической детализации характеристик пространственного распределения осадков в Московском регионе ====
 +
 +//**Ярынич Юлия Ивановна**(1,2), Варенцов Михаил Иванович(1,2,3), Криницкий Михаил Алексеевич(4,5,1), Степаненко Виктор Михайлович(1,2) \\ 
 +(1) Московский государственный университет имени М.В. Ломоносова, Научно-исследовательский вычислительный центр, (2) Институт физики атмосферы имени А.М. Обухова РАН, (3) Гидрометеорологический научно-исследовательский центр Российской Федерации, (4) Институт океанологии им. П.П. Ширшова РАН, Нахимовский проспект, (5) Московский физико-технический институ//
 +
 +В связи с наблюдаемыми изменениями климата учащающиеся экстремальные осадки оказывают влияние на различные регионы, включая Северную Евразию, и особенно разрушительны в крупных городах. Глобальные климатические изменения обычно оцениваются путем уменьшения масштаба крупномасштабных климатических характеристик, которые лучше разрешаются в климатических моделях, до мелкомасштабных переменных, которые не могут быть явно разрешены на сетке климатической модели. В предыдущих исследованиях изучались подходы машинного обучения для уменьшения масштаба осадков в нескольких регионах, но территория Московской агломерации, крупнейшей в России и Европе, осталась нетронутой, а ежегодный риск наводнений из-за экстремальных осадков в этом регионе остается очень высоким.
 +В данной работе методы машинного обучения в статистической детализации используются для получения характеристик пространственного распределения осадков (максимального значения, моментов распределения, квантилей) из полей гидродинамического моделирования с низким разрешением (реанализа ERA5). Для обучения статистических моделей (гребневой регрессии, градиентного бустинга, случайного леса) используются данные за 33 года наблюдений на метеостанциях Московского региона. В качестве признакового описания выступают физически обоснованные крупномасштабные предикторы осадков, рассчитанные с использованием данных реанализа ERA5. В их число входят как простые величины в толще атмосферы (температура, влажность и др.), так и сложные комплексные характеристики (CAPE, лапласиан приземного давления и др.). Наилучший результат по выбранным метрикам качества (RMSE, R2) достигается с использованием модели градиентного бустинга, при следующей конфигурации набора предикторов: осреднённые за сутки, стандартизованные, включая модельный предиктор осадков (среднее значение по площади). В работе показан рейтинг важности признаков крупномасштабных атмосферных предикторов для территории Московской области для различных конфигураций экспериментов и применённых моделей. \\ 
 +Работа выполнена при поддержке Некоммерческого фонда содействия развитию науки и образования «ИНТЕЛЛЕКТ».
 +
 ---- ----
  
-15+16
 ===== Section 3. Machine Learning in Natural Sciences ===== ===== Section 3. Machine Learning in Natural Sciences =====
  
Line 329: Line 331:
 ==== 86. Probabilistic Spiking Neural Network with Correlation-based Memristive Synaptic Updates ==== ==== 86. Probabilistic Spiking Neural Network with Correlation-based Memristive Synaptic Updates ====
  
-//**Alexander Sboev** (1,2), Dmitry Kunitsyn (1,2), Yury Davydov (1), Danila Vlasov (1), Alexey Serenko (1) and Roman Rybka (1,2) \\ (1) National Research Centre “Kurchatov Institute”, Moscow, Russia (2) National Research Nuclear University MEPhI, Moscow, Russia//+//**Dmitry Kunitsyn** (1,2), Alexander Sboev (1,2), Yury Davydov (1), Danila Vlasov (1), Alexey Serenko (1)and Roman Rybka (1,2) \\ (1) National Research Centre “Kurchatov Institute”, Moscow, Russia (2) National Research Nuclear University MEPhI, Moscow, Russia//
  
 Spiking Neural Networks (SNNs) are a biologically inspired class of neural models that encode information as discrete temporal impulses (spikes). These networks exhibit low latency and reduced power consumption, particularly when implemented on neuromorphic memristive hardware. However, efficient training of SNNs remains an active research area, as architectures trainable without error backpropagation could yield significant energy savings during both inference and training. Local plasticity rules offer a promising alternative, since they can be implemented in memristive devices. In this work, we introduce a lightweight, single-layer, correlation-based spiking neural network with probabilistic neurons. Owing to its compact and simple architecture, our model is potentially well suited for hardware realization. We evaluate its performance under both the classical spike-timing-dependent plasticity (STDP) and an experimentally-approximated nanocomposite memristive plasticity. Using the proposed correlation-based direct reinforcement training method, our network achieves high F1-scores across several tabular and image classification benchmarks for all considered plasticity models. In particular, the proposed approach yields 96% on the Fisher Iris dataset, 94% on the Wisconsin Breast Cancer dataset, and 89% on the Scikit-Learn Digits dataset when trained with regular STDP, and achieves comparable results on the nanocomposite plasticity. This suggests that the correlation-based SNN with probabilistic neurons is suitable for implementation in memristive hardware. Spiking Neural Networks (SNNs) are a biologically inspired class of neural models that encode information as discrete temporal impulses (spikes). These networks exhibit low latency and reduced power consumption, particularly when implemented on neuromorphic memristive hardware. However, efficient training of SNNs remains an active research area, as architectures trainable without error backpropagation could yield significant energy savings during both inference and training. Local plasticity rules offer a promising alternative, since they can be implemented in memristive devices. In this work, we introduce a lightweight, single-layer, correlation-based spiking neural network with probabilistic neurons. Owing to its compact and simple architecture, our model is potentially well suited for hardware realization. We evaluate its performance under both the classical spike-timing-dependent plasticity (STDP) and an experimentally-approximated nanocomposite memristive plasticity. Using the proposed correlation-based direct reinforcement training method, our network achieves high F1-scores across several tabular and image classification benchmarks for all considered plasticity models. In particular, the proposed approach yields 96% on the Fisher Iris dataset, 94% on the Wisconsin Breast Cancer dataset, and 89% on the Scikit-Learn Digits dataset when trained with regular STDP, and achieves comparable results on the nanocomposite plasticity. This suggests that the correlation-based SNN with probabilistic neurons is suitable for implementation in memristive hardware.
dlcp2025/program.1750445876.txt.gz · Last modified: by admin