Машинное обучение упрощает эксперименты с холодными атомами

Машинное обучение упрощает эксперименты с холодными атомами

Исходный узел: 3091277


Фотография вакуумной камеры с рубидиевой МОЛ, окруженной оптикой и системами визуализации.
Автоматические настройки: вид на вакуумную камеру, содержащую рубидиевую магнитооптическую ловушку (МОЛ) Тюбингенской группы. Частота лазеров МОТ контролируется агентом обучения с подкреплением. (Фото любезно предоставлено Мальте Райншмидтом)

Холодные атомы решают многие проблемы квантовой технологии. Хотите квантовый компьютер? Вы можете сделать один из массив ультрахолодных атомов. Нужен квантовый ретранслятор для защищенной сети связи? Холодные атомы ты покрыл. Как насчет квантового симулятора для сложных задач конденсированного состояния? Ага, холодные атомы тоже могу это сделать.

Обратной стороной является то, что выполнение любого из этих действий требует примерно две Нобелевские премии экспериментальной аппаратуры. Хуже того, малейшие источники расстройства – изменение лабораторной температуры, рассеянное магнитное поле (холодные атомы также создают отличные квантовые магнитометры), даже захлопнувшаяся дверь – может вывести из строя сложные комплексы лазеров, оптики, магнитных катушек и электроники, которые делают возможной физику холодных атомов.

Чтобы справиться с этой сложностью, физики холодного атома начали изучать способы использования машинного обучения для улучшения своих экспериментов. Например, в 2018 году команда Австралийского национального университета разработала машинно-оптимизированная процедура загрузки атомов в магнитооптические ловушки (МОТ), которые составляют отправную точку для экспериментов с холодными атомами. В 2019 году группа RIKEN в Японии применила этот принцип на более позднем этапе процесса охлаждения, используя машинное обучение для определить новые и эффективные способы охлаждения атомов до температур на долю градуса выше абсолютного нуля, где они переходят в квантовое состояние, известное как конденсат Бозе-Эйнштейна (БЭК).

Пусть машина сделает это

В рамках последней разработки в этом направлении две независимые группы физиков показали, что форма машинного обучения, известная как обучение с подкреплением, может помочь системам с холодным атомом справляться с сбоями.

«В нашей лаборатории мы обнаружили, что наша система производства БЭК была довольно нестабильной, так что у нас была возможность производить БЭК приемлемого качества только в течение нескольких часов в день», — объясняет Ник Милсон, аспирант Университета Альберты, Канада, который руководил один из проектов. Оптимизация этой системы вручную оказалась сложной задачей: «У вас есть процедура, основанная на сложной и, как правило, трудноразрешимой физике, и она усугубляется экспериментальным оборудованием, которое, естественно, будет иметь некоторую степень несовершенства», — говорит Милсон. «Вот почему многие группы решили проблему с помощью машинного обучения, и почему мы обращаемся к обучению с подкреплением, чтобы решить проблему создания согласованного и реактивного контроллера».

Обучение с подкреплением (RL) работает иначе, чем другие стратегии машинного обучения, которые принимают помеченные или немаркированные входные данные и используют их для прогнозирования результатов. Вместо этого RL стремится оптимизировать процесс, усиливая желаемые результаты и наказывая плохие.

В своем исследовании Милсон и его коллеги позволили агенту RL, называемому нейронной сетью актер-критик, настроить 30 параметров в своем аппарате для создания БЭК атомов рубидия. Они также предоставили агенту 30 параметров окружающей среды, измеренных во время предыдущего цикла создания BEC. «Можно думать об актере как о лице, принимающем решения, пытающемся выяснить, как действовать в ответ на различные стимулы окружающей среды», — объясняет Милсон. «Критик пытается выяснить, насколько хорошо будут исполнены действия актера. Его работа, по сути, заключается в предоставлении обратной связи субъекту путем оценки «хороших» или «плохих» потенциальных предпринятых действий».

Обучив своего агента RL на данных предыдущих экспериментов, физики из Альберты обнаружили, что контроллер, управляемый RL, постоянно превосходил людей при загрузке атомов рубидия в магнитную ловушку. По словам Милсона, основным недостатком было время, необходимое для сбора обучающих данных. «Если бы мы могли внедрить метод неразрушающей визуализации, такой как визуализация на основе флуоресценции, мы могли бы, по сути, заставить систему собирать данные постоянно, независимо от того, кто в данный момент использует систему или с какой целью», — говорит он. Мир физики.

Шаг за шагом

В отдельной работе физики под руководством Валентин Волчков из Института интеллектуальных систем Макса Планка и Тюбингенского университета, Германия, вместе со своим тюбингенским коллегой Андреас Гюнтер, применил другой подход. Вместо того, чтобы обучать своего агента RL оптимизации десятков экспериментальных параметров, они сосредоточились только на двух: градиенте магнитного поля МОЛ и частоте лазерного света, используемого для охлаждения и улавливания в нем атомов рубидия.

Оптимальное значение частоты лазера обычно такое, при котором образуется наибольшее количество атомов. N при самой низкой температуре T, Тем не менее, это оптимальные изменения значений когда температура падает из-за взаимодействия между атомами и лазерным светом. Поэтому команда из Тюбингена позволила своему агенту RL корректировать параметры с 25 последовательными временными шагами в течение 1.5-секундного цикла загрузки MOT и «наградила» его за максимальное приближение к желаемому значению. Н / Т в конце, как измерено с помощью флуоресцентной визуализации.

Хотя агент РЛ не придумал никаких ранее неизвестных стратегий охлаждения атомов в МОЛ (довольно скучный результат), шутит Волчков, он сделал экспериментальную установку более надежной. «Если во временном масштабе нашей выборки есть какое-то возмущение, то агент должен быть в состоянии отреагировать на него, если он соответствующим образом обучен», — говорит он. Такие автоматические настройки, добавляет он, будут иметь жизненно важное значение для создания портативных квантовых устройств, за которыми «аспиранты не смогут присматривать 24 часа в сутки, 7 дней в неделю».

Инструмент для сложных систем

Волчков считает, что RL может иметь более широкое применение в физике холодных атомов. «Я твердо верю, что обучение с подкреплением потенциально может привести к созданию новых режимов работы и нелогичных последовательностей управления, когда оно применяется к управлению экспериментами с ультрахолодным квантовым газом с достаточной степенью свободы», — говорит он. Мир физики. «Это особенно актуально для более сложных видов атомов и молекул. В конечном итоге анализ этих новых способов контроля может пролить свет на физические принципы, управляющие более экзотическими ультрахолодными газами».

Милсон с таким же энтузиазмом относится к потенциалу этой техники. «Сценарии использования, вероятно, безграничны и охватывают все области атомной физики», — говорит он. «От оптимизации загрузки атомов в оптические пинцеты до разработки протоколов в квантовой памяти для оптимального хранения и извлечения квантовой информации — машинное обучение, по-видимому, очень хорошо подходит для этих сложных сценариев с множеством тел, встречающихся в атомной и квантовой физике».

Работа команды Альберты опубликована в Машинное обучение: наука и технологии. Работа команды Тюбингена представлена ​​в ArXiv препринт.

  • 31 января 2024 года в эту статью были внесены поправки, чтобы уточнить принадлежность Валентина Волчкова и детали Тюбингенского эксперимента.

Отметка времени:

Больше от Мир физики