Машинне навчання усуває проблеми з експериментами з холодним атомом – Physics World

Машинне навчання усуває проблеми з експериментами з холодним атомом – Physics World

Вихідний вузол: 3091277


Фотографія вакуумної камери, що містить рубідієвий MOT, оточена оптикою та системами візуалізації
Автоматичні налаштування: вид на вакуумну камеру, що містить рубідієву магнітооптичну пастку (MOT) Тюбінгенської групи. Частота лазерів ТО контролюється агентом навчання підкріплення. (З люб’язного дозволу: Malte Reinschmidt)

Холодні атоми вирішують багато проблем квантової технології. Хочете квантовий комп’ютер? Ви можете зробити один із масив ультрахолодних атомів. Потрібен квантовий повторювач для захищеної мережі зв’язку? Холодні атоми Ви охопили?. Як щодо квантового симулятора для складних проблем конденсованого середовища? так, холодні атоми також може це зробити.

Недоліком є ​​те, що виконання будь-якої з цих речей вимагає приблизно дві Нобелівські премії експериментальної апаратури. Гірше того, найдрібніші джерела розладів – зміна температури в лабораторії, розсіяне магнітне поле (холодні атоми також роблять чудові квантові магнітометри), навіть грюкнуті двері – можуть вивести з ладу складні масиви лазерів, оптики, магнітних котушок та електроніки, які роблять можливою фізику холодного атома.

Щоб впоратися з цією складністю, фізики холодного атома почали досліджувати способи використання машинного навчання для розширення своїх експериментів. У 2018 році, наприклад, команда Австралійського національного університету розробила a машинно-оптимізовану програму для завантаження атомів у магнітооптичні пастки (MOT), які є відправною точкою для експериментів з холодним атомом. У 2019 році група RIKEN в Японії застосувала цей принцип до більш пізнього етапу процесу охолодження, використовуючи машинне навчання для визначити нові ефективні способи охолодження атомів до температур на частку градуса вище абсолютного нуля, де вони переходять у квантовий стан, відомий як конденсат Бозе-Ейнштейна (BEC).

Нехай машина зробить це

В останньому розвитку цієї тенденції дві незалежні групи фізиків показали, що форма машинного навчання, відома як навчання з підкріпленням, може допомогти системам з холодними атомами впоратися зі збоями.

«У нашій лабораторії ми виявили, що наша система виробництва BEC була досить нестабільною, так що ми мали можливість виробляти BEC прийнятної якості лише протягом кількох годин на день», — пояснює. Нік Мілсон, докторант Університету Альберти, Канада, який керував один із проектів. Ручна оптимізація цієї системи виявилася складною: «У вас є процедура, заснована на складній і загалом важкорозв’язній фізиці, і це ускладнюється експериментальним апаратом, який, природно, матиме певний ступінь недосконалості», — каже Мілсон. «Ось чому багато груп вирішували проблему за допомогою машинного навчання, і чому ми звертаємося до навчання з підкріпленням, щоб вирішити проблему побудови послідовного та реактивного контролера».

Навчання з підкріпленням (RL) працює інакше, ніж інші стратегії машинного навчання, які отримують позначені або немічені вхідні дані та використовують їх для прогнозування результатів. Натомість RL прагне оптимізувати процес, посилюючи бажані результати та караючи погані.

У своєму дослідженні Мілсон і його колеги дозволили агенту RL під назвою нейронна мережа актора-критика налаштувати 30 параметрів у своєму апараті для створення BEC атомів рубідію. Вони також надали агенту 30 параметрів навколишнього середовища, визначених під час попереднього циклу створення BEC. «Можна думати про актора як про особу, яка приймає рішення, намагаючись з’ясувати, як діяти у відповідь на різні подразники навколишнього середовища», — пояснює Мілсон. «Критик намагається з’ясувати, наскільки вдалими будуть дії актора. Його робота, по суті, полягає в тому, щоб надати акторові зворотний зв’язок, оцінюючи «хорошість» чи «поганість» потенційних вчинених дій».

Після навчання свого агента RL на даних попередніх експериментів фізики з Альберти виявили, що керований RL контролер незмінно перевершує людей у ​​завантаженні атомів рубідію в магнітну пастку. Головним недоліком, за словами Мілсона, був час, необхідний для збору навчальних даних. «Якщо б ми могли запровадити неруйнівну техніку візуалізації, як-от візуалізація на основі флуоресценції, ми могли б, по суті, мати систему постійного збору даних, незалежно від того, хто зараз використовує систему та з якою метою», — розповідає він. Світ фізики.

Крок за кроком

В окремій роботі фізики під керівництвом Валентин Волчков Інституту інтелектуальних систем імені Макса Планка та Тюбінгенського університету, Німеччина, разом зі своїм тюбінгенським колегою Андреас Гюнтер, застосував інший підхід. Замість того, щоб навчати свого агента RL оптимізувати десятки експериментальних параметрів, вони зосередилися лише на двох: градієнті магнітного поля MOT і частоті лазерного світла, яке використовується для охолодження та захоплення атомів рубідію в ньому.

Оптимальне значення частоти лазера, як правило, таке, при якому утворюється найбільша кількість атомів N при найнижчій температурі T. Однак це оптимальні зміни значення коли температура падає внаслідок взаємодії між атомами та лазерним світлом. Таким чином, команда з Тюбінгена дозволила своєму агенту RL налаштувати параметри за 25 послідовних часових кроків протягом 1.5-секундного циклу завантаження ТО і «винагородила» його за те, що він максимально наблизився до бажаного значення N/T в кінці, як виміряно за допомогою флуоресцентної візуалізації.

Хоча агент RL не придумав жодної раніше невідомої стратегії охолодження атомів під час ТО – «досить нудний результат», жартує Волчков, – це зробило експериментальний апарат більш надійним. «Якщо є певні збурення в часовому масштабі нашої вибірки, тоді агент повинен мати можливість відреагувати на це, якщо він відповідним чином навчений», — каже він. Такі автоматичні налаштування, додає він, будуть життєво важливі для створення портативних квантових пристроїв, за якими «аспіранти не зможуть доглядати за ними 24/7».

Інструмент для складних систем

Волчков вважає, що RL також може мати більш широке застосування у фізиці холодних атомів. «Я твердо вірю, що навчання з підкріпленням має потенціал для створення нових режимів операцій і неінтуїтивних послідовностей керування, якщо застосовувати їх до керування експериментами з ультрахолодним квантовим газом із достатнім ступенем свободи», — розповідає він. Світ фізики. «Це особливо актуально для більш складних атомів і молекул. Зрештою, аналіз цих нових режимів контролю може пролити світло на фізичні принципи, що керують більш екзотичними ультрахолодними газами».

Мілсон так само захоплений потенціалом техніки. «Варіанти використання, ймовірно, нескінченні, охоплюючи всі сфери атомної фізики», — каже він. «Від оптимізації завантаження атомів в оптичний пінцет до розробки протоколів у квантовій пам’яті для оптимального зберігання та отримання квантової інформації, машинне навчання, здається, дуже добре підходить для цих складних сценаріїв з багатьма тілами, які зустрічаються в атомній і квантовій фізиці».

Робота групи Альберта опублікована в Машинне навчання: наука і техніка. Робота команди з Тюбінгена представлена ​​в ArXiv передрук.

  • Цю статтю було змінено 31 січня 2024 року, щоб уточнити приналежність Валентина Волчкова та деталі Тюбінгенського експерименту.

Часова мітка:

Більше від Світ фізики