A nova IA do Google DeepMind corresponde ao desempenho da medalha de ouro nas Olimpíadas de Matemática

A nova IA do Google DeepMind corresponde ao desempenho da medalha de ouro nas Olimpíadas de Matemática

Nó Fonte: 3067930

Depois de decifrando uma matemática insolúvel problema no ano passado, a IA está de volta para enfrentar a geometria.

Desenvolvido pelo Google DeepMind, um novo algoritmo, AlphaGeometry, pode resolver problemas de Olimpíadas Internacionais de Matemática anteriores – uma competição de alto nível para alunos do ensino médio – e igualar o desempenho de anteriores medalhistas de ouro.

Quando desafiada com 30 problemas de geometria difíceis, a IA resolveu com sucesso 25 dentro do tempo padrão alocado, superando os algoritmos de última geração anteriores em 15 respostas.

Embora muitas vezes considerada a ruína das aulas de matemática do ensino médio, a geometria está inserida em nossa vida cotidiana. Arte, astronomia, design de interiores e arquitetura dependem da geometria. O mesmo acontece com a navegação, os mapas e o planejamento de rotas. Em sua essência, a geometria é uma forma de descrever espaço, formas e distâncias usando o raciocínio lógico.

De certa forma, resolver problemas de geometria é um pouco como jogar xadrez. Dadas algumas regras – chamadas teoremas e provas – há um número limitado de soluções para cada passo, mas descobrir qual delas faz sentido depende de um raciocínio flexível em conformidade com regras matemáticas rigorosas.

Em outras palavras, abordar a geometria requer criatividade e estrutura. Embora os humanos desenvolvam essas habilidades acrobáticas mentais ao longo de anos de prática, a IA sempre teve dificuldades.

AlphaGeometry combina inteligentemente ambos os recursos em um único sistema. Ele tem dois componentes principais: um modelo lógico baseado em regras que tenta encontrar uma resposta e um grande modelo de linguagem para gerar ideias prontas para uso. Se a IA não conseguir encontrar uma solução baseada apenas no raciocínio lógico, o modelo de linguagem entra em ação para fornecer novos ângulos. O resultado é uma IA com criatividade e habilidades de raciocínio que podem explicar a sua solução.

O sistema é a mais recente incursão da DeepMind na resolução de problemas matemáticos com inteligência de máquina. Mas seus olhos estão voltados para um prêmio maior. AlphaGeometry foi desenvolvido para raciocínio lógico em ambientes complexos – como nosso caótico mundo cotidiano. Além da matemática, futuras iterações poderão ajudar os cientistas a encontrar soluções noutros sistemas complicados, como decifrar ligações cerebrais ou desvendar redes genéticas que levam a doenças.

“Estamos dando um grande salto, um grande avanço em termos de resultados”, autor do estudo, Dr. Trieu Trinh disse que o New York Times.

Time duplo

Uma rápida questão de geometria: imagine um triângulo com ambos os lados de comprimento igual. Como você prova que os dois ângulos inferiores são exatamente iguais?

Este é um dos primeiros desafios enfrentados pela AlphaGeometry. Para resolvê-lo, você precisa compreender totalmente as regras da geometria, mas também ter criatividade para avançar em direção à resposta.

“A prova de teoremas mostra o domínio do raciocínio lógico… significando uma notável habilidade de resolução de problemas”, disse a equipe. escreveu em pesquisa publicada hoje em Natureza.

É aqui que a arquitetura do AlphaGeometry se destaca. Apelidado um sistema neuro-simbólico, primeiro aborda um problema com seu mecanismo de dedução simbólica. Imagine esses algoritmos como um aluno da série A que estuda estritamente livros didáticos de matemática e segue regras. Eles são guiados pela lógica e podem facilmente definir cada passo que leva a uma solução – como explicar uma linha de raciocínio em um teste de matemática.

Esses sistemas são antigos, mas incrivelmente poderosos, pois não apresentam o problema da “caixa preta” que assombra grande parte dos algoritmos modernos de aprendizagem profunda.

O aprendizado profundo remodelou nosso mundo. Mas devido à forma como esses algoritmos funcionam, muitas vezes eles não conseguem explicar sua saída. Isso simplesmente não funciona quando se trata de matemática, que depende de um raciocínio lógico rigoroso que pode ser escrito.

Os mecanismos de dedução simbólica neutralizam o problema da caixa preta, pois são racionais e explicáveis. Mas, confrontados com problemas complexos, são lentos e têm dificuldade em adaptar-se de forma flexível.

É aqui que entram os grandes modelos de linguagem. A força motriz por trás do ChatGPT, esses algoritmos são excelentes para encontrar padrões em dados complicados e gerar novas soluções, se houver dados de treinamento suficientes. Mas muitas vezes falta-lhes a capacidade de se explicarem, sendo necessário verificar novamente os seus resultados.

AlphaGeometry combina o melhor dos dois mundos.

Quando confrontado com um problema de geometria, o mecanismo de dedução simbólica tenta primeiro. Veja o problema do triângulo. O algoritmo “compreende” a premissa da questão, na medida em que precisa provar que os dois ângulos inferiores são iguais. O modelo de linguagem então sugere desenhar uma nova linha do topo do triângulo até a base para ajudar a resolver o problema. Cada novo elemento que move a IA em direção à solução é denominado “construção”.

O mecanismo de dedução simbólica segue o conselho e escreve a lógica por trás de seu raciocínio. Se a construção não funcionar, os dois sistemas passam por múltiplas rodadas de deliberação até que o AlphaGeometry chegue à solução.

Toda a configuração é “semelhante à ideia de ‘pensar rápido e devagar’” escreveu a equipe no blog da DeepMind. “Um sistema fornece ideias rápidas e ‘intuitivas’, e o outro, uma tomada de decisão mais deliberada e racional.”

Nós somos os campeões

Ao contrário dos arquivos de texto ou áudio, há escassez de exemplos focados em geometria, o que dificultou o treinamento do AlphaGeometry.

Como solução alternativa, a equipe gerou seu próprio conjunto de dados com 100 milhões de exemplos sintéticos de formas geométricas aleatórias e relações mapeadas entre pontos e linhas – semelhante à forma como você resolve geometria na aula de matemática, mas em uma escala muito maior.

A partir daí, a IA compreendeu as regras da geometria e aprendeu a trabalhar de trás para frente a partir da solução para descobrir se era necessário adicionar alguma construção. Este ciclo permitiu que a IA aprendesse do zero, sem qualquer intervenção humana.

Colocando a IA à prova, a equipe a desafiou com 30 problemas olímpicos de mais de uma década de competições anteriores. Os resultados gerados foram avaliados por Evan Chen, medalhista de ouro anterior nas Olimpíadas, para garantir sua qualidade.

Ao todo, a IA igualou o desempenho dos anteriores medalhistas de ouro, completando 25 problemas dentro do prazo. O resultado anterior do estado da arte foram 10 respostas corretas.

“O resultado do AlphaGeometry é impressionante porque é verificável e limpo”, Chen dito. “Ele usa regras de geometria clássica com ângulos e triângulos semelhantes, assim como os alunos fazem.”

Além da matemática

AlphaGeometry é a mais recente incursão da DeepMind na matemática. Em 2021, sua IA resolveu quebra-cabeças matemáticos que confundiam os humanos há décadas. Mais recentemente, eles usaram grandes modelos de linguagem para raciocinar problemas STEM em nível universitário e rachado um problema matemático anteriormente “insolúvel” baseado em um jogo de cartas com o algoritmo FunSearch.

Por enquanto, o AlphaGeometry é adaptado à geometria e com ressalvas. Grande parte da geometria é visual, mas o sistema não consegue “ver” os desenhos, o que poderia agilizar a resolução de problemas. Adicionando imagens, talvez com IA Gemini do Google, lançado no final do ano passado, pode reforçar a sua inteligência geométrica.

Uma estratégia semelhante também poderia expandir o alcance da AlphaGeometry a uma ampla gama de domínios científicos que exigem um raciocínio rigoroso com um toque de criatividade. (Sejamos realistas - são todos eles.)

“Dado o potencial mais amplo de treinar sistemas de IA do zero com dados sintéticos em grande escala, esta abordagem poderia moldar a forma como os sistemas de IA do futuro descobrem novos conhecimentos, em matemática e muito mais”, escreveu a equipe.

Crédito de imagem: Joel filipe / Unsplash 

Carimbo de hora:

Mais de Singularity Hub