O aprendizado de máquina facilita os experimentos com átomos frios – Physics World

O aprendizado de máquina facilita os experimentos com átomos frios – Physics World

Nó Fonte: 3091277


Foto da câmara de vácuo contendo o MOT de rubídio, cercada por sistemas ópticos e de imagem
Ajustes automáticos: Uma visão da câmara de vácuo que contém a armadilha magneto-óptica (MOT) de rubídio do grupo Tübingen. A frequência dos lasers MOT é controlada por um agente de aprendizagem por reforço. (Cortesia: Malte Reinschmidt)

Átomos frios resolvem muitos problemas na tecnologia quântica. Quer um computador quântico? Você pode fazer um de um matriz de átomos ultrafrios. Precisa de um repetidor quântico para uma rede de comunicações segura? Átomos frios você cobriu. Que tal um simulador quântico para problemas complicados de matéria condensada? Sim, átomos frios pode fazer isso também.

A desvantagem é que fazer qualquer uma dessas coisas requer aproximadamente dois prêmios Nobel de aparatos experimentais. Pior ainda, as menores fontes de perturbação – uma mudança na temperatura do laboratório, um campo magnético perdido (átomos frios também fazem excelentes magnetômetros quânticos), até mesmo uma porta batida – pode perturbar os complicados conjuntos de lasers, óptica, bobinas magnéticas e eletrônica que tornam possível a física do átomo frio.

Para lidar com esta complexidade, os físicos de átomos frios começaram a explorar formas de utilizar a aprendizagem automática para aumentar as suas experiências. Em 2018, por exemplo, uma equipe da Universidade Nacional Australiana desenvolveu um rotina otimizada por máquina para carregar átomos nas armadilhas magneto-ópticas (MOTs) que formam o ponto de partida para experimentos com átomos frios. Em 2019, um grupo da RIKEN, no Japão, aplicou este princípio a uma fase posterior do processo de arrefecimento, utilizando aprendizagem automática para identificar maneiras novas e eficazes de resfriar átomos a temperaturas uma fração de grau acima do zero absoluto, onde entram em um estado quântico conhecido como condensado de Bose-Einstein (BEC).

Deixe a máquina fazer isso

No mais recente desenvolvimento desta tendência, duas equipas independentes de físicos demonstraram que uma forma de aprendizagem automática conhecida como aprendizagem por reforço pode ajudar os sistemas de átomos frios a lidar com perturbações.

“Em nosso laboratório, descobrimos que nosso sistema de produção de BEC era bastante instável, de modo que só tínhamos a capacidade de produzir BECs de qualidade razoável durante algumas horas do dia”, explica Nick Milson, estudante de doutorado na Universidade de Alberta, Canadá, que liderou um dos projetos. A otimização manual deste sistema revelou-se um desafio: “Temos um procedimento sustentado por uma física complicada e geralmente intratável, e isto é agravado por um aparato experimental que naturalmente terá algum grau de imperfeição”, diz Milson. “É por isso que muitos grupos abordaram o problema com o aprendizado de máquina e recorremos ao aprendizado por reforço para resolver o problema de construir um controlador consistente e reativo.”

O aprendizado por reforço (RL) funciona de maneira diferente de outras estratégias de aprendizado de máquina que recebem dados de entrada rotulados ou não e os usam para prever resultados. Em vez disso, a VR visa optimizar um processo, reforçando os resultados desejáveis ​​e punindo os fracos.

Em seu estudo, Milson e colegas permitiram que um agente RL chamado rede neural ator-crítico ajustasse 30 parâmetros em seu aparelho para criar BECs de átomos de rubídio. Eles também forneceram ao agente 30 parâmetros ambientais detectados durante o ciclo anterior de criação do BEC. “Pode-se pensar no ator como o tomador de decisões, tentando descobrir como agir em resposta a diferentes estímulos ambientais”, explica Milson. “O crítico está tentando descobrir quão bem as ações do ator irão funcionar. A sua função é essencialmente fornecer feedback ao ator, avaliando a “bondade” ou a “maldade” das potenciais ações tomadas.”

Depois de treinar seu agente RL com base em dados de execuções experimentais anteriores, os físicos de Alberta descobriram que o controlador guiado por RL superou consistentemente os humanos no carregamento de átomos de rubídio em uma armadilha magnética. A principal desvantagem, diz Milson, foi o tempo necessário para coletar dados de treinamento. “Se pudéssemos introduzir uma técnica de imagem não destrutiva, como a imagem baseada em fluorescência, poderíamos essencialmente fazer com que o sistema coletasse dados o tempo todo, independentemente de quem estivesse usando o sistema no momento ou com que finalidade”, diz ele. Mundo da física.

Passo a passo

Em um trabalho separado, físicos liderados por Valentin Voltchkov do Instituto Max Planck de Sistemas Inteligentes e da Universidade de Tübingen, Alemanha, juntamente com seu colega de Tübingen Andreas Gunther, adotou uma abordagem diferente. Em vez de treinar seu agente RL para otimizar dezenas de parâmetros experimentais, eles se concentraram em apenas dois: o gradiente do campo magnético do MOT e a frequência da luz laser usada para resfriar e capturar átomos de rubídio nele.

O valor ideal da frequência do laser é geralmente aquele que produz o maior número de átomos. N na temperatura mais baixa T. No entanto, isso mudanças de valor ideal à medida que a temperatura cai devido às interações entre os átomos e a luz do laser. A equipe de Tübingen, portanto, permitiu que seu agente RL ajustasse os parâmetros em 25 intervalos de tempo sequenciais durante um ciclo de carregamento MOT de 1.5 segundo e o “recompensou” por chegar o mais próximo possível do valor desejado de N / T no final, conforme medido por imagem de fluorescência.

Embora o agente RL não tenha apresentado nenhuma estratégia até então desconhecida para resfriar átomos no MOT – “um resultado bastante chato”, brinca Volchkov – ele tornou o aparato experimental mais robusto. “Se houver alguma perturbação na escala de tempo da nossa amostragem, então o agente deverá ser capaz de reagir a ela se for treinado adequadamente”, diz ele. Esses ajustes automáticos, acrescenta ele, serão vitais para a criação de dispositivos quânticos portáteis que “não podem ter estudantes de doutorado cuidando deles 24 horas por dia, 7 dias por semana”.

Uma ferramenta para sistemas complexos

Volchkov acredita que a RL também poderia ter aplicações mais amplas na física de átomos frios. “Acredito firmemente que o aprendizado por reforço tem o potencial de produzir novos modos de operação e sequências de controle contra-intuitivas quando aplicado ao controle de experimentos de gases quânticos ultrafrios com graus de liberdade suficientes”, diz ele. Mundo da física. “Isso é especialmente relevante para espécies e moléculas atômicas mais complexas. Eventualmente, a análise desses novos modos de controle pode lançar luz sobre os princípios físicos que governam gases ultrafrios mais exóticos.”

Milson está igualmente entusiasmado com o potencial da técnica. “Os casos de uso são provavelmente infinitos, abrangendo todas as áreas da física atômica”, diz ele. “Desde a otimização do carregamento de átomos em pinças ópticas até o projeto de protocolos em memória quântica para armazenamento e recuperação ideais de informações quânticas, o aprendizado de máquina parece muito adequado para esses cenários complicados de muitos corpos encontrados na física atômica e quântica.”

O trabalho da equipe de Alberta é publicado em Aprendizado de máquina: ciência e tecnologia. O trabalho da equipe de Tübingen aparece em uma arXiv pré-impressão.

  • Este artigo foi alterado em 31 de janeiro de 2024 para esclarecer as afiliações de Valentin Volchkov e os detalhes do experimento de Tübingen.

Carimbo de hora:

Mais de Mundo da física