L’apprentissage automatique simplifie les expériences sur les atomes froids – Physics World

L’apprentissage automatique simplifie les expériences sur les atomes froids – Physics World

Nœud source: 3091277


Photo de la chambre à vide contenant le rubidium MOT, entourée d'optiques et de systèmes d'imagerie
Ajustements automatiques : Vue de la chambre à vide contenant le piège magnéto-optique au rubidium (MOT) du groupe de Tübingen. La fréquence des lasers MOT est contrôlée par un agent d'apprentissage par renforcement. (Avec l'aimable autorisation de Malte Reinschmidt)

Les atomes froids résolvent de nombreux problèmes de la technologie quantique. Vous voulez un ordinateur quantique ? Vous pouvez en fabriquer un à partir d'un tableau d'atomes ultrafroids. Besoin d'un répéteur quantique pour un réseau de communications sécurisé ? Atomes froids as tu couvert. Que diriez-vous d’un simulateur quantique pour des problèmes complexes de matière condensée ? Ouais, atomes froids peut le faire aussi.

L'inconvénient est que pour réaliser l'une de ces choses, il faut environ deux prix Nobel d'appareils expérimentaux. Pire encore, les plus petites sources de perturbation – un changement de température dans le laboratoire, un champ magnétique parasite (les atomes froids excellents magnétomètres quantiques), même une porte claquée – peut perturber les réseaux complexes de lasers, d’optiques, de bobines magnétiques et d’électronique qui rendent possible la physique des atomes froids.

Pour faire face à cette complexité, les physiciens des atomes froids ont commencé à explorer les moyens d’utiliser l’apprentissage automatique pour enrichir leurs expériences. En 2018, par exemple, une équipe de l’Université nationale australienne a développé un routine optimisée par machine pour charger des atomes dans les pièges magnéto-optiques (MOT) qui constituent le point de départ des expériences sur les atomes froids. En 2019, un groupe de RIKEN au Japon a appliqué ce principe à une étape ultérieure du processus de refroidissement, en utilisant l'apprentissage automatique pour identifier des moyens nouveaux et efficaces de refroidir les atomes à des températures situées à une fraction de degré au-dessus du zéro absolu, où ils entrent dans un état quantique connu sous le nom de condensat de Bose-Einstein (BEC).

Laissez la machine faire

Dans le dernier développement de cette tendance, deux équipes indépendantes de physiciens ont montré qu'une forme d'apprentissage automatique connue sous le nom d'apprentissage par renforcement peut aider les systèmes à atomes froids à gérer les perturbations.

"Dans notre laboratoire, nous avons constaté que notre système de production de BEC était assez instable, de sorte que nous n'avions la capacité de produire des BEC de qualité raisonnable que quelques heures par jour", explique Nick Milson, doctorant à l'Université de l'Alberta, Canada, qui a dirigé un des projets. L'optimisation manuelle de ce système s'est avérée un véritable défi : « Vous disposez d'une procédure qui s'appuie sur une physique complexe et généralement insoluble, et à laquelle s'ajoute un appareil expérimental qui présente naturellement un certain degré d'imperfection », explique Milson. "C'est pourquoi de nombreux groupes se sont attaqués au problème de l'apprentissage automatique et pourquoi nous nous tournons vers l'apprentissage par renforcement pour résoudre le problème de la construction d'un contrôleur cohérent et réactif."

L'apprentissage par renforcement (RL) fonctionne différemment des autres stratégies d'apprentissage automatique qui prennent en compte des données d'entrée étiquetées ou non et les utilisent pour prédire les sorties. Au lieu de cela, RL vise à optimiser un processus en renforçant les résultats souhaitables et en punissant les mauvais.

Dans leur étude, Milson et ses collègues ont permis à un agent RL appelé réseau neuronal acteur-critique d'ajuster 30 paramètres dans leur appareil pour créer des BEC d'atomes de rubidium. Ils ont également fourni à l’agent 30 paramètres environnementaux détectés lors du précédent cycle de création de BEC. "On peut considérer l'acteur comme un décideur, essayant de comprendre comment agir en réponse à différents stimuli environnementaux", explique Milson. «Le critique essaie de déterminer dans quelle mesure les actions de l'acteur vont être performantes. Son travail consiste essentiellement à fournir un retour d'information à l'acteur en évaluant le « bon » ou le « mal » des actions potentielles entreprises.

Après avoir formé leur agent RL sur les données des expériences expérimentales précédentes, les physiciens de l'Alberta ont découvert que le contrôleur guidé par RL surpassait systématiquement les humains pour charger des atomes de rubidium dans un piège magnétique. Le principal inconvénient, selon Milson, était le temps nécessaire à la collecte des données de formation. "Si nous pouvions introduire une technique d'imagerie non destructive telle que l'imagerie basée sur la fluorescence, nous pourrions essentiellement faire en sorte que le système collecte des données à tout moment, peu importe qui utilise actuellement le système ou dans quel but", explique-t-il. Monde de la physique.

Pas à pas

Dans un travail distinct, des physiciens dirigés par Valentin Volchkov de l'Institut Max Planck pour les systèmes intelligents et de l'Université de Tübingen, en Allemagne, avec son collègue de Tübingen Andreas Gunther, a adopté une approche différente. Au lieu de former leur agent RL pour optimiser des dizaines de paramètres expérimentaux, ils se sont concentrés sur deux seulement : le gradient du champ magnétique du MOT et la fréquence de la lumière laser utilisée pour refroidir et piéger les atomes de rubidium.

La valeur optimale de la fréquence laser est généralement celle qui produit le plus grand nombre d'atomes N à la température la plus basse T. Cependant, cela changements de valeur optimale à mesure que la température baisse en raison des interactions entre les atomes et la lumière laser. L'équipe de Tübingen a donc permis à son agent RL d'ajuster les paramètres à 25 pas de temps séquentiels au cours d'un cycle de chargement MOT d'une durée de 1.5 seconde, et l'a « récompensé » pour s'être rapproché le plus possible de la valeur souhaitée de NT à la fin, tel que mesuré par imagerie de fluorescence.

Même si l’agent RL n’a pas mis au point de stratégies jusqu’alors inconnues pour refroidir les atomes du MOT – « un résultat assez ennuyeux », plaisante Volchkov – il a néanmoins rendu l’appareil expérimental plus robuste. "S'il y a une perturbation à l'échelle de temps de notre échantillonnage, alors l'agent devrait être capable d'y réagir s'il est formé en conséquence", dit-il. De tels ajustements automatiques, ajoute-t-il, seront essentiels pour créer des dispositifs quantiques portables qui « ne peuvent pas être surveillés par des doctorants 24 heures sur 7, XNUMX jours sur XNUMX ».

Un outil pour les systèmes complexes

Volchkov pense que RL pourrait également avoir des applications plus larges en physique des atomes froids. "Je crois fermement que l'apprentissage par renforcement a le potentiel de produire de nouveaux modes de fonctionnement et des séquences de contrôle contre-intuitives lorsqu'il est appliqué au contrôle d'expériences sur les gaz quantiques ultrafroids avec des degrés de liberté suffisants", explique-t-il. Monde de la physique. « Ceci est particulièrement pertinent pour les espèces et molécules atomiques plus complexes. À terme, l’analyse de ces nouveaux modes de contrôle pourrait faire la lumière sur les principes physiques régissant des gaz ultra-froids plus exotiques.

Milson est également enthousiasmé par le potentiel de cette technique. « Les cas d’utilisation sont probablement infinis et couvrent tous les domaines de la physique atomique », dit-il. "De l'optimisation du chargement des atomes dans des pinces optiques à la conception de protocoles dans la mémoire quantique pour un stockage et une récupération optimaux des informations quantiques, l'apprentissage automatique semble très bien adapté à ces scénarios complexes à plusieurs corps que l'on trouve en physique atomique et quantique."

Les travaux de l'équipe albertaine sont publiés dans Apprentissage automatique : science et technologie. Le travail de l'équipe de Tübingen apparaît dans un arXiv pré-impression.

  • Cet article a été modifié le 31 janvier 2024 pour clarifier les affiliations de Valentin Volchkov et les détails de l'expérience de Tübingen.

Horodatage:

Plus de Monde de la physique