Strojno učenje olajša poskuse s hladnimi atomi – svet fizike

Strojno učenje olajša poskuse s hladnimi atomi – svet fizike

Izvorno vozlišče: 3091277


Fotografija vakuumske komore, ki vsebuje rubidijevo MOT, obdano z optiko in slikovnimi sistemi
Samodejne prilagoditve: Pogled v vakuumsko komoro, ki vsebuje rubidijevo magnetno-optično past (MOT) skupine Tübingen. Frekvenco MOT laserjev nadzira sredstvo za učenje okrepitve. (Z dovoljenjem: Malte Reinschmidt)

Hladni atomi rešujejo številne probleme v kvantni tehnologiji. Želite kvantni računalnik? Enega lahko naredite iz niz ultrahladnih atomov. Potrebujete kvantni repetitor za varno komunikacijsko omrežje? Hladni atomi ste pokrili. Kaj pa kvantni simulator za zapletene probleme s kondenzirano snovjo? Ja, hladni atomi zmore tudi to.

Slaba stran je, da opravljanje katere koli od teh stvari zahteva v vrednosti približno dveh Nobelovih nagrad eksperimentalnih aparatov. Še huje, najmanjši viri motenj – sprememba laboratorijske temperature, blodeče magnetno polje (tudi hladni atomi odlični kvantni magnetometri), tudi zaloputnjena vrata – lahko vznemirijo zapletene nize laserjev, optike, magnetnih tuljav in elektronike, ki omogočajo fiziko hladnih atomov.

Da bi se spopadli s to kompleksnostjo, so fiziki hladnih atomov začeli raziskovati načine uporabe strojnega učenja za izboljšanje svojih eksperimentov. Leta 2018 je na primer skupina na Avstralski nacionalni univerzi razvila a strojno optimizirana rutina za nalaganje atomov v magnetno-optične pasti (MOT), ki tvorijo izhodišče za poskuse s hladnimi atomi. Leta 2019 je skupina pri RIKEN na Japonskem to načelo uporabila za poznejšo fazo procesa hlajenja z uporabo strojnega učenja za prepoznati nove in učinkovite načine hlajenja atomov na temperature za delček stopinje nad absolutno ničlo, kjer preidejo v kvantno stanje, znano kot Bose-Einsteinov kondenzat (BEC).

Naj to naredi stroj

V najnovejšem razvoju tega trenda sta dve neodvisni ekipi fizikov pokazali, da lahko oblika strojnega učenja, znana kot učenje z okrepitvijo, pomaga sistemom s hladnimi atomi pri obvladovanju motenj.

»V našem laboratoriju smo ugotovili, da je bil naš sistem za proizvodnjo BEC dokaj nestabilen, tako da smo lahko proizvajali BEC primerne kakovosti le nekaj ur v dnevu,« pojasnjuje. Nick Milson, doktorski študent na Univerzi Alberta v Kanadi, ki je vodil enega od projektov. Ročno optimiziranje tega sistema se je izkazalo za zahtevno: "Imate postopek, ki temelji na zapleteni in na splošno nerešljivi fiziki, to pa dopolnjuje eksperimentalna naprava, ki bo seveda imela določeno stopnjo nepopolnosti," pravi Milson. "Zato so se številne skupine lotile problema s strojnim učenjem in zakaj se obračamo na učenje z okrepitvijo, da bi rešili problem izgradnje doslednega in reaktivnega krmilnika."

Okrepitveno učenje (RL) deluje drugače od drugih strategij strojnega učenja, ki sprejemajo označene ali neoznačene vhodne podatke in jih uporabljajo za predvidevanje rezultatov. Namesto tega želi RL optimizirati proces s krepitvijo zaželenih rezultatov in kaznovanjem slabih.

V svoji študiji so Milson in njegovi sodelavci dovolili agentu RL, imenovanemu igralsko-kritična nevronska mreža, da prilagodi 30 parametrov v njihovi napravi za ustvarjanje BEC atomov rubidija. Agentu so priskrbeli tudi 30 okoljskih parametrov, zaznanih med prejšnjim ciklom ustvarjanja BEC. "O igralcu lahko razmišljamo kot o odločevalcu, ki poskuša ugotoviti, kako se odzvati na različne okoljske dražljaje," pojasnjuje Milson. »Kritik poskuša ugotoviti, kako dobro bodo dejanja igralca izvedena. Njegova naloga je v bistvu zagotoviti povratno informacijo akterju z ocenjevanjem 'dobrega' ali 'slabega' morebitnih izvedenih dejanj.«

Potem ko so svojega agenta RL usposobili na podlagi podatkov iz prejšnjih poskusov, so fiziki iz Alberte ugotovili, da je krmilnik, ki ga vodi RL, vedno boljši od ljudi pri nalaganju atomov rubidija v magnetno past. Glavna pomanjkljivost, pravi Milson, je bil čas, potreben za zbiranje podatkov o usposabljanju. »Če bi lahko uvedli tehniko nedestruktivnega slikanja, kot je slikanje na osnovi fluorescence, bi lahko sistem dejansko ves čas zbiral podatke, ne glede na to, kdo trenutno uporablja sistem ali za kakšen namen,« pravi. Svet fizike.

Korak za korakom

V ločenem delu so fiziki pod vodstvom Valentin Volčkov z Inštituta Maxa Plancka za inteligentne sisteme in Univerze v Tübingenu, Nemčija, skupaj s kolegom iz Tübingena Andreas Günther, ubral drugačen pristop. Namesto da bi svojega agenta RL usposobili za optimizacijo na desetine eksperimentalnih parametrov, so se osredotočili le na dva: gradient magnetnega polja MOT in frekvenco laserske svetlobe, ki se uporablja za hlajenje in lovljenje atomov rubidija v njem.

Optimalna vrednost laserske frekvence je na splošno tista, ki proizvede največje število atomov N pri najnižji temperaturi T. Toda to optimalne spremembe vrednosti ko temperatura pade zaradi interakcij med atomi in lasersko svetlobo. Ekipa iz Tübingena je zato dovolila svojemu agentu RL, da prilagodi parametre v 25 zaporednih časovnih korakih med 1.5-sekundnim ciklom nalaganja MOT, in ga "nagradila", ker se je čim bolj približal želeni vrednosti N/T na koncu, merjeno s fluorescenčnim slikanjem.

Medtem ko agent RL ni prišel do nobene prej neznane strategije za hlajenje atomov v MOT - "precej dolgočasen rezultat", se šali Volčkov -, je naredil eksperimentalno napravo bolj robustno. »Če pride do motenj v časovni lestvici našega vzorčenja, bi se agent moral na to odzvati, če je ustrezno usposobljen,« pravi. Takšne samodejne prilagoditve, dodaja, bodo ključnega pomena za ustvarjanje prenosnih kvantnih naprav, za katere "doktorski študenti ne morejo skrbeti 24 ur na dan, 7 dni v tednu".

Orodje za kompleksne sisteme

Volčkov meni, da bi RL lahko imel tudi širše aplikacije v fiziki hladnih atomov. "Trdno verjamem, da ima učenje z ojačitvijo potencial za ustvarjanje novih načinov delovanja in protiintuitivnih kontrolnih zaporedij, če se uporablja za nadzor eksperimentov z ultrahladnimi kvantnimi plini z zadostnimi stopnjami svobode," pravi. Svet fizike. "To je še posebej pomembno za kompleksnejše atomske vrste in molekule. Sčasoma bi lahko analiza teh novih načinov nadzora osvetlila fizikalna načela, ki urejajo bolj eksotične ultrahladne pline.

Milson je podobno navdušen nad potencialom tehnike. "Primeri uporabe so verjetno neskončni in zajemajo vsa področja atomske fizike," pravi. "Od optimizacije nalaganja atomov v optične pincete do oblikovanja protokolov v kvantnem pomnilniku za optimalno shranjevanje in pridobivanje kvantnih informacij se strojno učenje zdi zelo primerno za te zapletene scenarije z več telesi, ki jih najdemo v atomski in kvantni fiziki."

Delo ekipe Alberta je objavljeno v Strojno učenje: znanost in tehnologija. Delo ekipe Tübingen je prikazano v arXiv predtisk.

  • Ta članek je bil spremenjen 31. januarja 2024, da pojasni povezanost Valentina Volčkova in podrobnosti o eksperimentu v Tübingenu.

Časovni žig:

Več od Svet fizike