L'apprendimento automatico elimina i problemi dagli esperimenti sugli atomi freddi – Physics World

L'apprendimento automatico elimina i problemi dagli esperimenti sugli atomi freddi – Physics World

Nodo di origine: 3091277


Foto della camera a vuoto contenente il MOT al rubidio, circondata da ottiche e sistemi di imaging
Regolazioni automatiche: una vista della camera a vuoto contenente la trappola magneto-ottica al rubidio (MOT) del gruppo di Tubinga. La frequenza dei laser MOT è controllata da un agente di apprendimento di rinforzo. (Per gentile concessione di Malte Reinschmidt)

Gli atomi freddi risolvono molti problemi nella tecnologia quantistica. Vuoi un computer quantistico? Puoi crearne uno da un schiera di atomi ultrafreddi. Hai bisogno di un ripetitore quantistico per una rete di comunicazione sicura? Atomi freddi hai coperto. Che ne dici di un simulatore quantistico per complicati problemi di materia condensata? Sì, atomi freddi può farlo anche tu.

Lo svantaggio è che è necessario fare una qualsiasi di queste cose vale circa due premi Nobel di apparati sperimentali. Peggio ancora, le più piccole fonti di disturbo – un cambiamento nella temperatura del laboratorio, un campo magnetico disperso (anche gli atomi freddi creano eccellenti magnetometri quantistici), anche una porta sbattuta – può sconvolgere i complicati sistemi di laser, ottica, bobine magnetiche ed elettronica che rendono possibile la fisica dell’atomo freddo.

Per far fronte a questa complessità, i fisici dell’atomo freddo hanno iniziato a esplorare modi di utilizzare l’apprendimento automatico per potenziare i loro esperimenti. Nel 2018, ad esempio, un team dell’Australian National University ha sviluppato un routine ottimizzata per la macchina per caricare gli atomi nelle trappole magneto-ottiche (MOT) che costituiscono il punto di partenza per gli esperimenti sugli atomi freddi. Nel 2019, un gruppo del RIKEN in Giappone ha applicato questo principio a una fase successiva del processo di raffreddamento, utilizzando l’apprendimento automatico per identificare modi nuovi ed efficaci per raffreddare gli atomi a temperature una frazione di grado sopra lo zero assoluto, dove entrano in uno stato quantistico noto come condensato di Bose-Einstein (BEC).

Lasciamo che sia la macchina a farlo

Nell’ultimo sviluppo di questa tendenza, due team indipendenti di fisici hanno dimostrato che una forma di apprendimento automatico nota come apprendimento per rinforzo può aiutare i sistemi di atomi freddi a gestire le interruzioni.

"Nel nostro laboratorio, abbiamo scoperto che il nostro sistema di produzione di BEC era piuttosto instabile, tanto che avevamo la capacità di produrre BEC di qualità ragionevole solo per poche ore al giorno", spiega Nick Milson, uno studente di dottorato presso l'Università di Alberta, Canada, che ha guidato uno dei progetti. L'ottimizzazione manuale di questo sistema si è rivelata impegnativa: "Abbiamo una procedura sostenuta da una fisica complicata e generalmente intrattabile, a cui si aggiunge un apparato sperimentale che naturalmente presenterà un certo grado di imperfezione", afferma Milson. “Questo è il motivo per cui molti gruppi hanno affrontato il problema con l’apprendimento automatico e perché ci rivolgiamo all’apprendimento per rinforzo per affrontare il problema della costruzione di un controller coerente e reattivo”.

L'apprendimento per rinforzo (RL) funziona in modo diverso dalle altre strategie di apprendimento automatico che acquisiscono dati di input etichettati o non etichettati e li utilizzano per prevedere gli output. Invece, RL mira a ottimizzare un processo rafforzando i risultati desiderabili e punendo quelli scadenti.

Nel loro studio, Milson e colleghi hanno consentito a un agente RL chiamato rete neurale attore-critica di regolare 30 parametri nel loro apparato per creare BEC di atomi di rubidio. Hanno inoltre fornito all'agente 30 parametri ambientali rilevati durante il precedente ciclo di creazione del BEC. "Si può pensare all'attore come a colui che prende le decisioni, cercando di capire come agire in risposta a diversi stimoli ambientali", spiega Milson. “Il critico sta cercando di capire quanto bene si comporteranno le azioni dell'attore. Il suo compito è essenzialmente quello di fornire un feedback all’attore valutando la “bontà” o la “cattiveria” delle potenziali azioni intraprese”.

Dopo aver addestrato il loro agente RL sui dati di precedenti esecuzioni sperimentali, i fisici dell'Alberta hanno scoperto che il controller guidato da RL ha costantemente prestazioni superiori a quelle umane nel caricare atomi di rubidio in una trappola magnetica. Lo svantaggio principale, afferma Milson, era il tempo necessario per raccogliere i dati di addestramento. "Se potessimo introdurre una tecnica di imaging non distruttiva come l'imaging basato sulla fluorescenza, potremmo essenzialmente far sì che il sistema raccolga dati in ogni momento, indipendentemente da chi sta attualmente utilizzando il sistema o per quale scopo", dice Mondo della fisica.

Passo dopo passo

In un lavoro separato, i fisici guidati da Valentin Volčkov dell'Istituto Max Planck per i sistemi intelligenti e dell'Università di Tubinga, Germania, insieme al suo collega di Tubinga Andreas Gunther, ha adottato un approccio diverso. Invece di addestrare il loro agente RL a ottimizzare dozzine di parametri sperimentali, si sono concentrati solo su due: il gradiente del campo magnetico del MOT e la frequenza della luce laser utilizzata per raffreddare e intrappolare gli atomi di rubidio al suo interno.

Il valore ottimale della frequenza laser è generalmente quello che produce il maggior numero di atomi N alla temperatura più bassa T. Tuttavia, questo variazioni di valore ottimali man mano che la temperatura diminuisce a causa delle interazioni tra gli atomi e la luce laser. Il team di Tubinga ha quindi consentito al proprio agente RL di regolare i parametri in 25 fasi temporali sequenziali durante un ciclo di caricamento MOT di 1.5 secondi e lo ha "premiato" per essersi avvicinato il più possibile al valore desiderato di N / T alla fine, come misurato mediante imaging a fluorescenza.

Sebbene l’agente RL non abbia escogitato strategie precedentemente sconosciute per raffreddare gli atomi nel MOT – “un risultato piuttosto noioso”, scherza Volchkov – ha reso l’apparato sperimentale più robusto. "Se si verifica qualche perturbazione nell'arco temporale del nostro campionamento, l'agente dovrebbe essere in grado di reagire se addestrato di conseguenza", afferma. Tali aggiustamenti automatici, aggiunge, saranno vitali per la creazione di dispositivi quantistici portatili che “non possono essere assistiti da dottorandi 24 ore su 7, XNUMX giorni su XNUMX”.

Uno strumento per sistemi complessi

Volchkov ritiene che la RL potrebbe avere applicazioni più ampie anche nella fisica degli atomi freddi. "Credo fermamente che l'apprendimento per rinforzo abbia il potenziale per produrre nuove modalità operative e sequenze di controllo controintuitive quando applicato al controllo di esperimenti su gas quantistici ultrafreddi con sufficienti gradi di libertà", dice Mondo della fisica. “Ciò è particolarmente rilevante per le specie e le molecole atomiche più complesse. Alla fine, l’analisi di queste nuove modalità di controllo potrebbe far luce sui principi fisici che governano i gas ultrafreddi più esotici”.

Milson è altrettanto entusiasta del potenziale della tecnica. "I casi d'uso sono probabilmente infiniti e abbracciano tutte le aree della fisica atomica", afferma. “Dall’ottimizzazione del caricamento degli atomi nelle pinzette ottiche, alla progettazione di protocolli nella memoria quantistica per l’archiviazione e il recupero ottimali delle informazioni quantistiche, l’apprendimento automatico sembra molto adatto a questi complicati scenari a molti corpi presenti nella fisica atomica e quantistica”.

Il lavoro del team dell'Alberta è pubblicato in Apprendimento automatico: scienza e tecnologia. Il lavoro del team di Tubinga appare in un arXiv preprint.

  • Questo articolo è stato modificato il 31 gennaio 2024 per chiarire le affiliazioni di Valentin Volchkov e i dettagli dell'esperimento di Tubinga.

Timestamp:

Di più da Mondo della fisica