Description

Проект реализуется в рамках программы "ПРИОРИТЕТ 2030".
Достижение поставленной цели проекта будет осуществляться путём реализации научных тематик, соответствующих направлениям Стратегии научно-технологического развития Российской Федерации (Указ Президента Российской Федерации от 1 декабря 2016 г. № 642 «О Стратегии научно-технологического развития Российской Федерации»). Финансирование этих научных тематик будет осуществляться за счёт внебюджетного и/или конкурсного бюджетного финансирования, в том числе средств гранта в форме субсидии из федерального бюджета, предоставленного на оказание поддержки Программы развития УрФУ на 2021-2030 гг. в рамках реализации программы стратегического академического лидерства «Приоритет-2030» (Постановление Правительства Российской Федерации от 13 мая 2021 года № 729), которые будут направлены на реализацию научной тематики «Применение теории сложности и алгоритмов машинного обучения для решения задач характеризации в квантовом компьютинге, биологии и материаловедении», прошедшей конкурсный отбор.
Описание реализуемой за счёт средств ПСАЛ «Приоритет 2030» научной тематики «Применение теории сложности и алгоритмов машинного обучения для решения задач характеризации в квантовом компьютинге, биологии и материаловедении»:
1) Решаемая проблема.
Одним из фундаментальных способов получения информации о какой-либо системе является визуальное наблюдение за её состояниями либо напрямую с помощью глаз либо опосредованно при помощи различных экспериментальных приборов. Например, в случае нанообъектов исследователь может делать выводы о состояниях системы по её изображениям, полученным при помощи микроскопии или спектроскопии различных типов. В случае новейших вычислительных устройств - квантовых компьютеров исследователь оперирует результатами измерений в виде последовательностей нулей и единиц, по которым делает вывод об исходном состоянии и эволюции квантовой системы. Вне зависимости от способа графического представления исследуемой системы такие данные могут содержать паттерны, зависимости, повторяющиеся структуры и т.п., выявление которых представляется важнейшим шагом для классификации и характеризации объекта. В ряде случаев такая задача легко решается человеком, но учитывая экспоненциальный рост объемов информации и тот факт, что исследователям приходится иметь дело с объектами все более сложной структуры, то актуальной задачей становится построение автоматических компьютерных методов, способных заменить человека и решать задачу характеризации быстро и эффективно. Популярные в настоящее время методы машинного обучения потенциально позволяют решать эту проблему для совершенного разных классов объектов в науке и из обычной жизни. Но ключевым моментом здесь является доступ к большому объему тренировочных данных, обеспечивающих достижение необходимой производительности алгоритмом в ходе обучения. Еще более сложной задачей для человека и компьютерных подходов является выявление паттернов во времени, когда система эволюционирует между различными промежуточными состояниями. К дополнительным факторам, усложняющим решение проблемы характеризации, в общем случае можно отнести стохастический характер поведения системы, наличие ограниченного шумного набора экспериментальных данных. Кроме того, применение численной схемы, натренированной на одном типе данных, обычно ограничено частной задачей в конкретной области знаний. Все это обеспечивает актуальность разработки новых универсальных подходов для характеризации разных классов объектов, не требующих обучения. Именно, решению этой задачи и посвящен данный проект, в котором за основу берется разработанный нами недавно метод количественной оценки структурной сложности [PNAS 117, 30241 (2020)] и предлагается его модификация для решения актуальных задач квантового компьютинга, биологии и материаловедения.
2) Актуальность решения обозначенной проблемы
Описание квантовых состояний систем, состоящих из тысяч кубит и больше, имеет принципиальное значение для дальнейшего развития всей отрасли квантового компьютинга. Невозможно решать какие-либо задачи с использованием квантовых состояний, о типе и структуре которых мы не имеем никакой информации и никак не контролируем. Из-за экспоненциального роста пространства Гильберта с числом кубит, используемых в квантовых вычислениях, мы не можем выполнить точную симуляцию квантового состояния на классических компьютерах и проследить его эволюцию при наращивании квантовой цепочки. Насколько квантовое состояние, которым мы манипулируем, близко по структуре к уже известным нам? Является ли состояние локализованным или делокализованным в пространстве Гильберта? Насколько конкретное квантовое со-стояние устойчиво к шумам и неидеальностям, возникающим при выполнении квантовых операций на реальных квантовых устройствах? Как меняется состояние при наращивании квантовой цепочки? Для того, чтобы иметь возможность ответить на эти и другие подобные вопросы необходима интенсивная методическая работа по разработке алгоритмов, использующих в качестве опорной информации битовые строчки, полученные в результате небольшого числа измерений.
Решение задачи характеризации волновых функций имеет принципиальное значение для развития квантовой теории информации. Здесь реальные эксперименты, выполняемые на существующих квантовых компьютерах, позволяют проверять множество теоретических идей и предлагать новые [Science 374, 1479 (2021)]. Одним из интересных вопросов, привлекающих внимание исследователей, является изучение процесса скрэмблинга - распространения информации при формировании запутанного квантового состояния из тривиального. Не смотря на то, что исходная информация является постоянной величиной, она кодируется в глобальной запутанности и, таким образом, становится недоступной для локальных измерений. Исследование процесса скрэмблинга имеет важнейшее значение при разработке квантовых методов машинного обучения [Nat. Commun. 9, 4812 (2018)], а также при моделировании нетривиальных фаз вещества, таких как многочастичная локализация Андерсона [Ann. Phys. 321, 1126 – 1205 (2006)].
В свою очередь разработка методов машинного обучения для анализа броуновского движения наночастиц привлекает значительное внимание исследователей, специализирующихся в биологии, медицине, физике и др. областях. Об этом можно судить по большому числу научных публикаций, а также по тому, что проводятся международные конкурсы по разработке эффективных алгоритмов [AnDi Challenge, Nat Commun 12, 6253 (2021)], при помощи которых по небольшому числу кадров жизни системы необходимо определить характер движения, а также оценить физически релевантные величины, такие как коэффициент диффузии, аномальную экспоненту и др. Такая концентрация на оперировании малым количестве шумных траекторий обусловлена тем фактом, что накопление больших объемов высокоточных данных о движении частиц на ультра-коротких временах требует применения специальных дорогостоящих экспериментальных установок, доступных лишь в нескольких лабораториях мира [Science 314, 626 (2006), Nano Lett. 2020, 20, 7213−7219]. Экспериментальные методики, используемые большинством исследователей для изучения отдельных нанообъектов, ограничивают применение традиционные статистические методы обработки из-за качества и недостатка экспериментальных данных. Еще более серьезным вызовом является теоретическая характеризация коллективного поведения систем, состоящих из множества наночастиц, в которых возможно наблюдать не только стохастическое движение [Nano Letters 7, 3329 (2007)], но формирование упорядоченных структур [Nanoscale 10, 18205 (2018)]. Здесь также основной задачей является извлечение максимума полезной информации о системе из небольшого числа шумных кадров, что можно достигать в том числе методами машинного обучения [ACS Nano 15, 6471 (2021)].
Текущий уровень развития методов первопринципного моделировани и модельных подходов позволил к настоящему времени детально описать свойства огромного числа реальных и гипотетических материалов. Имеющиеся данные обеспечивают фундамент для перехода к вопросу исследования механизмов поведения искомого свойства материала, а также его описания набором физически значимых параметров - дескриптором. Одним из наиболее ярких исторических приме-ров дескриптора является периодическая таблица Менделеева, в которой каждому элементу ставиться в соответствие два числа: индексы строки и столбца. В первоначальной версии таблицы были пустые места, однако свойства еще не открытых химических элементов можно было грубо предсказать по их положению в ней. Конструирование хороших дескрипторов является нетривиальной задачей, так как зачастую они являются входными данными для алгоритмов машинного обучения и, следовательно, должны отвечать определенным требованиям. Для наиболее распространенных в материаловедении задач существуют стандартные подходы, такие как построение кулоновской матрицы [PRL 108, 058301 (2012)] и многочастичное тензорное представление [arXiv:1704.06439], а также библиотеки для их автоматического построения и использования [Computer Physics Communications, 247, 106949 (2020)]. Вместе с тем, выявление параметров, наиболее полно описывающих то или иное свойство само по себе является одной из основных задач теории машинного обучения. Так, простейшие регрессионные алгоритмы могут с высокой точностью выделить низкоразмерный дескриптор, позволяющий предсказать кристаллическую структуру соединения, из десятков тысяч параметров материала и их всевозможных комбинаций [PRL 114, 105503 (2015)]. Тем не менее, подавляющее большинство современных дескрипторов построены на основе скалярных величин и не учитывают характер зависимости свойств материала (намагниченности, теплоемкости и т. д.) от внешних параметров, а также информации, содержащейся в изображениях электронной микроскопии, рассчитываемых или получаемых экспериментально электронных и магнитных спектрах, распределениях зарядовой плотности и др. Это исключает из рассмотрения огромный объем имеющейся важной информации о конкретной системе. Применение теории структурной сложности позволит однозначным образом заменить функциональные зависимости различных наблюдаемых или рассчитываемых свойств конкретными числами, тем самым увеличив описательную способность полученного дескриптора.
3) Описание задач, предлагаемых к решению
Задача 1. Исследование фазовых переходов в неравновесных квантовых системах
Фазовые переходы в неравновесных квантовых системах будут исследоваться в рамках формализма Флоке. Стартуя с произвольного квантового состояния будет задаваться временная эволюция квантовой системы, определяемая гамильтонианами как с парными, так и с мультикубитными стохастическими взаимодействиями. В фокусе этих исследований будет определение фазовых границ систем, характеризующихся состояниями с многочастичной локализацией Андерсона, а также состояния дискретного временного кристалла (discrete time crystal). Разрабатываемые методы оценки и анализа паттернов станут новой альтернативой широко используемым в настоящее время подходам, основанным на вычислении громоздких временно-зависящих корреляционных функций. С моделированием неравновесных систем связана проблема скрэмблинга - распространение информации между квантовыми степенями свободы при построении квантовых цепочек. Различные механизмы скрэмблинга будут анализироваться на основе численной оценки паттернов состояний, между которыми эволюционирует квантовая система. Будут также анализироваться фазовые переходы, возникающие за счет конкуренции между динамикой скрэмблинга, приводящей к многочастичной запутанности между всеми степенями свободы квантовой системы, и локальными измерениями, разрушающими запутанность.
Задача 2. Разработка машинных методов для характеризации коллективного диффузного движения наночастиц.
Адаптация метода расчета структурной сложности статических картинок для обработки потокового видео с записью движения отдельных нанообъектов и коллективного движения множества наночастиц в пиксельном формате. Генерирование тестовых данных с использованием моделей для различных типов броуновского движения, направленного движения и смешанного движения для индивидуальных частиц и ансамблей частиц. Определение пороговой чувствительности численной схемы к изменению характеристик и типа физического движения. Тестирование численное схемы при обработке данных в пиксельном формате с шумами и неидеальностями. Применение разработанной схемы для обработки реальных экспериментальных видео, доступных в научных базах данных. Поиск взаимосвязи полученной количественной оценки пространственной и временной сложности экспериментальных видео с экспериментально релевантными величинами - коэффициент диффузии, коэффициент вязкости среды и др. Декодируя экспериментальные видео с движением нанообъектов при помощи разработанной методики мы сможем ответить на технологически важные вопросы. Например, определить время и скорость испускания вещества, заложенное в нанотрубку, по изменению характера её движения. Или проследить изменение свойств жидкой среды во времени.
Задача 3. Применение теории структурной сложности для создания дескрипторов материалов
Адаптация схемы расчета структурной сложности для низкоразмерного представления зависимостей свойств материалов от внешних параметров, а также информации, содержащейся в изображениях электронной микроскопии, рассчитываемых или получаемых экспериментально электронных и магнитных спектрах возбуждений, распределениях зарядовой плотности и других данных. Тестирование методики будет проводиться на результатах модельных расчетов для магнитных систем. Определение чувствительности полученной схемы к особенностям структуры обрабатываемых графиков, а также шумам в данных. Поиск параметров материала, на предсказание и оценку которых окажет существенное влияние добавление в дескриптор полученных величин. Определение оптимальной структуры дескриптора и алгоритмов машинного обучения, необходимых для работы с ним. Разработанная методика позволит оценить влияние ранее не учитываемых данных на предсказание свойств и структуры новейших материалов.
4) Практическая значимость ожидаемых результатов
Построенные фазовые диаграммы ряда систем с использованием разрабатываемого метода характеризации квантовых состояний на основе паттернов битовых строк и дескрипторы будут использованы при проектировании реальных устройств.
5) План работ на 2022-2024 год
- 2022 год
Выполнить моделирование временной эволюции квантовых систем, управляемой гамильтонианами изинговского типа с парными и мультикубитными взаимодействиями, выбираемыми случайным образом на каждом временном шаге, и стартующей с произвольных начальных условий. Построить фазовые диаграммы ряда систем с использованием разрабатываемого метода характеризации квантовых состояний на основе паттернов битовых строк и провести детальное сравнение с данными, полученными в предыдущих работах.
- 2023 год
Разработать численнй метод для характеризации движения отдельных нанообъектов и коллективного движения множества наночастиц с обработкой данных в пиксельном формате. Провести сравнение с методами машинного обучения по степени чувствительности каждого из подходов к изменению параметров движения, вызванных неидеальностями экспериментальных условий и шумами. Выполнить декодирование и классификацию движения для ряда реальных экспериментальных видео, доступных в научных базах данных. Определить взаимосвязь между полученной количественной оценкой пространственно-временной сложности движения нанообъектов и экспериментально релевантными величинами - коэффициентом диффузии, коэффициентом вязкости среды и др.
- 2024 год
Разработать оптимальную схему преобразования графиков зависимостей свойств материалов от внешних параметров, электронных и магнонных спектров возбуждений, снимков электронной микроскопии, распределений зарядов и других массивов данных в скалярные величины, а также оценить ее устойчивость по отношению к шумам в данных. При помощи алгоритмов машинного обучения, направленных на выделение значимых свойств, определить задачи, в которых новые данные войдут в состав дескрипторов.
Коллектив Научного центра компетенций руководствуется в своей работе Положением о научных центрах компетенций СМК-ПВД-7-01-287-2022, введённым в действие приказом №439/03 от 04.05.2022.

Key findings

Портфель "Научные центры компетенций"
Acronym4.72
StatusActive
Effective start/end date01/07/202231/12/2024

    Financing

  • Financing: Act 729 Government of the Russian Federation, contract № 075-15-2021-1331

ID: 33826362