Uczenie maszynowe eliminuje problemy z eksperymentami na zimnych atomach – Physics World

Uczenie maszynowe eliminuje problemy z eksperymentami na zimnych atomach – Physics World

Węzeł źródłowy: 3091277


Zdjęcie komory próżniowej zawierającej rubidowy MOT, otoczonej optyką i systemami obrazowania
Korekty automatyczne: widok na komorę próżniową zawierającą rubidową pułapkę magnetooptyczną (MOT) grupy Tübingen. Częstotliwość laserów MOT jest kontrolowana przez środek uczenia się przez wzmacnianie. (Dzięki uprzejmości: Malte Reinschmidt)

Zimne atomy rozwiązują wiele problemów w technologii kwantowej. Chcesz komputer kwantowy? Możesz zrobić taki z szereg ultrazimnych atomów. Potrzebujesz wzmacniacza kwantowego do bezpiecznej sieci komunikacyjnej? Zimne atomy czy jesteś objęty?. Co powiesz na symulator kwantowy do rozwiązywania skomplikowanych problemów z materią skondensowaną? Tak, zimne atomy też to może zrobić.

Wadą jest to, że wykonanie dowolnej z tych rzeczy wymaga warte około dwóch nagród Nobla aparatury doświadczalnej. Co gorsza, najmniejsze źródła niepokoju – zmiana temperatury w laboratorium, rozproszone pole magnetyczne (zimne atomy też powodują doskonałe magnetometry kwantowe), nawet trzaśnięte drzwiami – mogą wytrącić z równowagi skomplikowane układy laserów, optyki, cewek magnetycznych i elektroniki, które umożliwiają fizykę zimnych atomów.

Aby poradzić sobie z tą złożonością, fizycy zajmujący się zimnymi atomami rozpoczęli badanie sposobów wykorzystania uczenia maszynowego do usprawnienia swoich eksperymentów. Na przykład w 2018 roku zespół z Australijskiego Uniwersytetu Narodowego opracował zoptymalizowana maszynowo procedura ładowania atomów do pułapek magnetooptycznych (MOT), które stanowią punkt wyjścia dla eksperymentów z zimnymi atomami. W 2019 r. grupa w RIKEN w Japonii zastosowała tę zasadę na późniejszym etapie procesu chłodzenia, wykorzystując uczenie maszynowe do zidentyfikować nowe i skuteczne sposoby chłodzenia atomów do temperatur o ułamek stopnia powyżej zera absolutnego, gdzie wchodzą w stan kwantowy znany jako kondensat Bosego-Einsteina (BEC).

Niech zrobi to maszyna

W ramach najnowszego osiągnięcia tego trendu dwa niezależne zespoły fizyków wykazały, że forma uczenia maszynowego znana jako uczenie się przez wzmacnianie może pomóc systemom zimnych atomów radzić sobie z zakłóceniami.

„W naszym laboratorium odkryliśmy, że nasz system produkcji BEC był dość niestabilny, w związku z czym byliśmy w stanie wytwarzać BEC o rozsądnej jakości jedynie przez kilka godzin dziennie” – wyjaśnia Nicka Milsona, doktorant na Uniwersytecie Alberta w Kanadzie, który kierował jeden z projektów. Ręczna optymalizacja tego systemu okazała się wyzwaniem: „Masz procedurę opartą na skomplikowanej i ogólnie niewykonalnej fizyce, a całość dodatkowo potęguje aparatura eksperymentalna, która naturalnie będzie miała pewien stopień niedoskonałości” – mówi Milson. „Dlatego wiele grup rozwiązało problem uczenia maszynowego i dlatego zwracamy się do uczenia przez wzmacnianie, aby rozwiązać problem zbudowania spójnego i reaktywnego kontrolera”.

Uczenie się przez wzmacnianie (RL) działa inaczej niż inne strategie uczenia maszynowego, które pobierają oznaczone lub nieoznaczone dane wejściowe i wykorzystują je do przewidywania wyników. Zamiast tego RL ma na celu optymalizację procesu poprzez wzmacnianie pożądanych wyników i karanie słabych.

W swoim badaniu Milson i współpracownicy pozwolili agentowi RL zwanemu siecią neuronową krytyczną dla aktorów dostosować 30 parametrów w swoim aparacie w celu tworzenia BEC atomów rubidu. Dostarczyli także agentowi 30 parametrów środowiskowych wykrytych podczas poprzedniego cyklu tworzenia BEC. „Można pomyśleć o aktorze jako o decydentu próbującym dowiedzieć się, jak działać w odpowiedzi na różne bodźce środowiskowe” – wyjaśnia Milson. „Krytyk próbuje dowiedzieć się, jak dobrze wypadną działania aktora. Jego zadaniem jest zasadniczo przekazywanie aktorowi informacji zwrotnej poprzez ocenę „dobrości” lub „złości” potencjalnych podjętych działań.

Po przeszkoleniu agenta RL na podstawie danych z poprzednich eksperymentów fizycy z Alberty odkryli, że kontroler sterowany RL konsekwentnie radzi sobie lepiej z ludźmi w ładowaniu atomów rubidu do pułapki magnetycznej. Główną wadą, mówi Milson, był czas potrzebny na zebranie danych szkoleniowych. „Gdybyśmy mogli wprowadzić nieniszczącą technikę obrazowania, taką jak obrazowanie oparte na fluorescencji, moglibyśmy zasadniczo mieć system gromadzący dane przez cały czas, niezależnie od tego, kto aktualnie z niego korzysta i w jakim celu” – mówi Świat Fizyki.

Krok po kroku

W osobnej pracy fizycy pod przewodnictwem Walenty Wołczkow z Instytutu Inteligentnych Systemów Maxa Plancka i Uniwersytetu w Tybindze w Niemczech wraz ze swoim kolegą z Tybingi Andreas Günther, przyjął inne podejście. Zamiast szkolić swojego agenta RL w zakresie optymalizacji dziesiątek parametrów eksperymentalnych, skupili się tylko na dwóch: gradiencie pola magnetycznego MOT i częstotliwości światła lasera używanego do chłodzenia i wychwytywania w nim atomów rubidu.

Optymalna wartość częstotliwości lasera to zazwyczaj taka, która wytwarza największą liczbę atomów N w najniższej temperaturze T. Jednak to optymalne zmiany wartości wraz ze spadkiem temperatury w wyniku interakcji między atomami a światłem lasera. Dlatego zespół z Tybingi pozwolił swojemu agentowi RL na dostosowanie parametrów w 25 kolejnych krokach podczas 1.5-sekundowego cyklu ładowania MOT i „nagrodził” go za osiągnięcie jak najbliżej żądanej wartości N / T na końcu, jak zmierzono za pomocą obrazowania fluorescencyjnego.

Chociaż agent RL nie zaproponował żadnych nieznanych wcześniej strategii chłodzenia atomów w MOT – „dość nudny wynik”, żartuje Wołczkow – to jednak wzmocnił aparaturę eksperymentalną. „Jeśli w skali czasowej naszego próbkowania wystąpią jakieś zakłócenia, agent powinien być w stanie na nie zareagować, jeśli zostanie odpowiednio przeszkolony” – mówi. Dodaje, że takie automatyczne dostosowania będą niezbędne do stworzenia przenośnych urządzeń kwantowych, nad którymi „doktoranci nie będą mogli opiekować się nimi przez całą dobę”, dodaje.

Narzędzie dla złożonych systemów

Volchkov uważa, że ​​RL może mieć również szersze zastosowanie w fizyce zimnych atomów. „Głęboko wierzę, że uczenie się przez wzmacnianie może potencjalnie zaowocować nowymi trybami działania i sprzecznymi z intuicją sekwencjami kontrolnymi, jeśli zostanie zastosowane do kontrolowania eksperymentów z ultrazimnym gazem kwantowym z wystarczającym stopniem swobody” – mówi Świat Fizyki. „Jest to szczególnie istotne w przypadku bardziej złożonych gatunków atomów i cząsteczek. Ostatecznie analiza tych nowych sposobów kontroli może rzucić światło na zasady fizyczne rządzące bardziej egzotycznymi ultrazimnymi gazami”.

Milson jest podobnie entuzjastycznie nastawiony do potencjału tej techniki. „Przypadki użycia są prawdopodobnie nieograniczone i obejmują wszystkie obszary fizyki atomowej” – mówi. „Od optymalizacji ładowania atomów do pęsety optycznej po projektowanie protokołów w pamięci kwantowej w celu optymalnego przechowywania i wyszukiwania informacji kwantowych, uczenie maszynowe wydaje się bardzo dobrze dostosowane do tych skomplikowanych scenariuszy obejmujących wiele ciał, występujących w fizyce atomowej i kwantowej”.

Praca zespołu Alberta została opublikowana w Uczenie maszynowe: nauka i technologia. Praca zespołu z Tybingi pojawia się w: arXiv przedruk.

  • Artykuł ten został zmieniony 31 stycznia 2024 r. w celu wyjaśnienia powiązań Walentina Wołczkowa i szczegółów eksperymentu w Tybindze.

Znak czasu:

Więcej z Świat Fizyki