Лаборатория анализа данных физики высоких энергий ТГУ

Анализ данных в мегасайенс-проектах

Наша лаборатория участвует в обработке и интерпретации данных крупнейших международных экспериментов в области физики высоких энергий, ускорительной физики и синхротронных исследований. Мы работаем с коллаборациями NICA (ОИЯИ, Дубна), СКИФ (Новосибирск) и CERN (LHC), разрабатывая методы статистического анализа, машинного обучения и визуализации больших данных.

Основные направления работы

NICA (Дубна)

Анализ столкновений тяжелых ионов, поиск новых состояний кварк-глюонной плазмы, разработка алгоритмов реконструкции событий.

СКИФ (Новосибирск)

Обработка данных рентгеновских и синхротронных экспериментов, автоматизация анализа дифракционных изображений.

Большой адронный коллайдер (CERN)

Участие в экспериментах ATLAS/CMS/LHCb: поиск новой физики, прецизионные измерения свойств бозона Хиггса, разработка методов уменьшения фона.

Научные руководители и контакты

Ирина Владимировна Шрейбер
заместитель заведующего лабораторией
Мария Валерьевна Диденко
младший научный сотрудник
Вадим Викторович Костюхин
старший научный сотрудник
Дмитрий Николаевич Старков
старший научный сотрудник

Стек технологий

  • Программное обеспечение:

    • ROOT, CERN’s Analysis Framework

    • Python (SciPy, NumPy, scikit-learn, TensorFlow/PyTorch)

    • C++ (для высокопроизводительных вычислений)

  • Системы хранения и обработки:

    • Hadoop/Spark для больших массивов данных

    • SQL/NoSQL базы (MySQL, MongoDB)

  • Визуализация:

    • Matplotlib, Plotly, D3.js для интерактивных дашбордов

Примеры проектов

  1. Анализ открытых данных CERN (2015–2016):

    • Работа с открытыми данными ATLAS (формат DAOD_PHYSLITE) с целью воссоздания и расширения опубликованных анализов.

    • Повторение анализа: “Measurements of top-quark pair to Z-boson cross-section ratios at √s = 7, 8, 13 TeV with the ATLAS detector”

    • Расширение на более сложный анализ: “Evidence for the H→bb decay with the ATLAS detector”

  2. Применение методов машинного обучения в физике высоких энергий:

    • Использование открытых данных и Monte Carlo симуляций для повторения анализа с применением современных ML-моделей (графовые сети, трансформеры, diffusion models и др.).

    • Повторение стандартных анализов: измерения, поиски новых частиц

    • Оптимизация фазовых пространств и переменных с помощью ML

    • Разработка методических рекомендаций по проектированию анализа

  3. Оптимизация выбора переменных в анализе рождения трех бозонов:

    • Повторение анализа: “Search for W±W∓Z and W±ZZ production in pp collisions at √s = 13 TeV with the ATLAS detector”

    • Цель: уменьшение систематических ошибок за счёт выбора более устойчивых входных переменных

    • Итог: разработка подходов к систематической оптимизации анализа

  4. Изучение и применение ATLAS b-tagging фреймворка на основе нейросетей:

    • Разбор архитектуры и принципов работы ML-фреймворка ATLAS для b-tagging.

    • Повторение результатов ATLAS

    • Использование фреймворка для собственных задач и курсов подготовки студентов