El aprendizaje automático elimina los problemas de los experimentos con átomos fríos – Physics World

El aprendizaje automático elimina los problemas de los experimentos con átomos fríos – Physics World

Nodo de origen: 3091277


Foto de la cámara de vacío que contiene el MOT de rubidio, rodeada de sistemas ópticos y de imágenes.
Ajustes automáticos: una vista de la cámara de vacío que contiene la trampa magnetoóptica de rubidio (MOT) del grupo de Tubinga. La frecuencia de los láseres MOT está controlada por un agente de aprendizaje por refuerzo. (Cortesía: Malte Reinschmidt)

Los átomos fríos resuelven muchos problemas de la tecnología cuántica. ¿Quieres una computadora cuántica? Puedes hacer uno desde un conjunto de átomos ultrafríos. ¿Necesita un repetidor cuántico para una red de comunicaciones segura? Átomos fríos has cubierto. ¿Qué tal un simulador cuántico para problemas complicados de materia condensada? Sí, átomos fríos También puedo hacer eso.

La desventaja es que hacer cualquiera de estas cosas requiere aproximadamente dos premios Nobel de aparatos experimentales. Peor aún, las fuentes más pequeñas de perturbación: un cambio en la temperatura del laboratorio, un campo magnético disperso (los átomos fríos también producen excelentes magnetómetros cuánticos), incluso un portazo, puede perturbar los complicados conjuntos de láseres, ópticas, bobinas magnéticas y electrónicas que hacen posible la física del átomo frío.

Para hacer frente a esta complejidad, los físicos de átomos fríos han comenzado a explorar formas de utilizar el aprendizaje automático para ampliar sus experimentos. En 2018, por ejemplo, un equipo de la Universidad Nacional de Australia desarrolló un rutina optimizada por máquina para cargar átomos en las trampas magnetoópticas (MOT) que forman el punto de partida para experimentos con átomos fríos. En 2019, un grupo de RIKEN en Japón aplicó este principio a una etapa posterior del proceso de enfriamiento, utilizando el aprendizaje automático para Identificar formas nuevas y efectivas de enfriar los átomos. a temperaturas de una fracción de grado por encima del cero absoluto, donde entran en un estado cuántico conocido como condensado de Bose-Einstein (BEC).

Deja que la máquina lo haga

En el último avance de esta tendencia, dos equipos independientes de físicos han demostrado que una forma de aprendizaje automático conocida como aprendizaje por refuerzo puede ayudar a los sistemas de átomos fríos a manejar las interrupciones.

"En nuestro laboratorio, descubrimos que nuestro sistema de producción de BEC era bastante inestable, de modo que solo teníamos la capacidad de producir BEC de calidad razonable durante unas pocas horas al día", explica Nick Milson, estudiante de doctorado de la Universidad de Alberta, Canadá, que dirigió uno de los proyectos. Optimizar este sistema a mano resultó ser un desafío: "Tienes un procedimiento respaldado por una física complicada y generalmente intratable, y esto se ve agravado por un aparato experimental que naturalmente tendrá cierto grado de imperfección", dice Milson. "Esta es la razón por la que muchos grupos han abordado el problema con el aprendizaje automático y por la que recurrimos al aprendizaje por refuerzo para abordar el problema de construir un controlador consistente y reactivo".

El aprendizaje por refuerzo (RL) funciona de manera diferente a otras estrategias de aprendizaje automático que toman datos de entrada etiquetados o no etiquetados y los utilizan para predecir resultados. En cambio, la RL pretende optimizar un proceso reforzando los resultados deseables y castigando los deficientes.

En su estudio, Milson y sus colegas permitieron que un agente RL llamado red neuronal actor-crítica ajustara 30 parámetros en su aparato para crear BEC de átomos de rubidio. También proporcionaron al agente 30 parámetros ambientales detectados durante el ciclo anterior de creación de BEC. "Se puede pensar en el actor como quien toma las decisiones, tratando de descubrir cómo actuar en respuesta a diferentes estímulos ambientales", explica Milson. “El crítico intenta descubrir qué tan bien se desempeñarán las acciones del actor. Su trabajo es esencialmente proporcionar retroalimentación al actor evaluando la 'bondad' o la 'maldad' de las posibles acciones tomadas”.

Después de entrenar a su agente RL con datos de ejecuciones experimentales anteriores, los físicos de Alberta descubrieron que el controlador guiado por RL superó consistentemente a los humanos al cargar átomos de rubidio en una trampa magnética. El principal inconveniente, afirma Milson, fue el tiempo necesario para recopilar datos de entrenamiento. "Si pudiéramos introducir una técnica de imágenes no destructiva como las imágenes basadas en fluorescencia, básicamente podríamos hacer que el sistema recopile datos todo el tiempo, sin importar quién estuviera usando el sistema actualmente o con qué propósito", dice. Mundo de la física.

Paso a paso

En un trabajo separado, físicos dirigidos por Valentin Vólchkov del Instituto Max Planck de Sistemas Inteligentes y la Universidad de Tübingen, Alemania, junto con su colega de Tübingen Andreas Gunther, adoptó un enfoque diferente. En lugar de entrenar a su agente RL para optimizar docenas de parámetros experimentales, se centraron en solo dos: el gradiente del campo magnético del MOT y la frecuencia de la luz láser utilizada para enfriar y atrapar átomos de rubidio en él.

El valor óptimo de la frecuencia del láser es generalmente aquel que produce el mayor número de átomos. N a la temperatura más baja T. Sin embargo, este cambios de valor óptimo a medida que la temperatura cae debido a las interacciones entre los átomos y la luz láser. Por lo tanto, el equipo de Tubinga permitió a su agente RL ajustar los parámetros en 25 pasos de tiempo secuenciales durante un ciclo de carga MOT de 1.5 segundos de duración, y lo "recompensó" por acercarse lo más posible al valor deseado de NUEVO TESTAMENTO al final, según lo medido mediante imágenes de fluorescencia.

Si bien al agente de RL no se le ocurrió ninguna estrategia previamente desconocida para enfriar los átomos en el MOT –“un resultado bastante aburrido”, bromea Volchkov–, sí hizo que el aparato experimental fuera más robusto. "Si hay alguna perturbación en la escala de tiempo de nuestro muestreo, entonces el agente debería poder reaccionar si está entrenado en consecuencia", dice. Estos ajustes automáticos, añade, serán vitales para crear dispositivos cuánticos portátiles que “no puedan tener estudiantes de doctorado atendiéndolos las 24 horas del día, los 7 días de la semana”.

Una herramienta para sistemas complejos

Volchkov cree que RL también podría tener aplicaciones más amplias en la física de átomos fríos. "Creo firmemente que el aprendizaje por refuerzo tiene el potencial de producir nuevos modos de operaciones y secuencias de control contraintuitivas cuando se aplica al control de experimentos con gases cuánticos ultrafríos con suficientes grados de libertad", dice. Mundo de la física. “Esto es especialmente relevante para especies y moléculas atómicas más complejas. Con el tiempo, el análisis de estos nuevos modos de control podría arrojar luz sobre los principios físicos que rigen los gases ultrafríos más exóticos”.

Milson está igualmente entusiasmado con el potencial de la técnica. "Los casos de uso probablemente sean infinitos y abarquen todas las áreas de la física atómica", afirma. "Desde la optimización de la carga de átomos en pinzas ópticas hasta el diseño de protocolos en la memoria cuántica para un almacenamiento y recuperación óptimos de información cuántica, el aprendizaje automático parece muy adecuado para estos escenarios complicados de muchos cuerpos que se encuentran en la física atómica y cuántica".

El trabajo del equipo de Alberta se publica en Aprendizaje automático: ciencia y tecnología. El trabajo del equipo de Tübingen aparece en un arXiv preprint.

  • Este artículo fue modificado el 31 de enero de 2024 para aclarar las afiliaciones de Valentin Volchkov y los detalles del experimento de Tubinga.

Sello de tiempo:

Mas de Mundo de la física