Google DeepMinds nye AI matcher guldmedaljepræstationer i matematik-OL

Google DeepMinds nye AI matcher guldmedaljepræstationer i matematik-OL

Kildeknude: 3067930

Efter knække en uløselig matematik problem sidste år, AI er tilbage for at tackle geometri.

Udviklet af Google DeepMind, en ny algoritme, AlphaGeometry, kan knuse problemer fra tidligere internationale matematiske olympiader – en konkurrence på højeste niveau for gymnasieelever – og matcher tidligere guldmedaljevinderes præstationer.

Da den blev udfordret med 30 vanskelige geometriproblemer, løste AI 25 med succes inden for den tildelte standardtid og slog tidligere avancerede algoritmer med 15 svar.

Selvom det ofte betragtes som elendigheden i matematiktimerne i gymnasiet, er geometri indlejret i vores hverdag. Kunst, astronomi, interiørdesign og arkitektur er alle afhængige af geometri. Det samme gør navigation, kort og ruteplanlægning. I sin kerne er geometri en måde at beskrive rum, former og afstande ved hjælp af logisk ræsonnement.

På en måde er det at løse geometriproblemer lidt som at spille skak. Givet nogle regler - kaldet teoremer og beviser - er der et begrænset antal løsninger til hvert trin, men at finde hvilken der giver mening afhænger af fleksible ræsonnementer, der er i overensstemmelse med strenge matematiske regler.

Med andre ord kræver det både kreativitet og struktur at tackle geometri. Mens mennesker udvikler disse mentale akrobatiske færdigheder gennem mange års praksis, har AI altid kæmpet.

AlphaGeometry kombinerer smart begge funktioner i et enkelt system. Den har to hovedkomponenter: En regelbundet logisk model, der forsøger at finde et svar, og en stor sprogmodel til at generere ud-af-boksen ideer. Hvis AI ikke formår at finde en løsning baseret på logisk ræsonnement alene, begynder sprogmodellen at give nye vinkler. Resultatet er en AI med både kreativitet og ræsonnementskompetencer, der kan forklare dens løsning.

Systemet er DeepMinds seneste forsøg på at løse matematiske problemer med maskinintelligens. Men deres øjne er rettet mod en større præmie. AlphaGeometry er bygget til logisk ræsonnement i komplekse miljøer – såsom vores kaotiske hverdagsverden. Ud over matematik kan fremtidige iterationer potentielt hjælpe videnskabsmænd med at finde løsninger i andre komplicerede systemer, såsom at dechifrere hjerneforbindelser eller optrevle genetiske væv, der fører til sygdom.

"Vi laver et stort hop, et stort gennembrud med hensyn til resultatet," undersøgelsesforfatter Dr. Trieu Trinh fortalt og New York Times.

Dobbelt Team

Et hurtigt geometrispørgsmål: Forestil dig en trekant med begge sider lige lange. Hvordan beviser du, at de to nederste vinkler er nøjagtigt ens?

Dette er en af ​​de første udfordringer, AlphaGeometry stod over for. For at løse det skal du fuldt ud forstå reglerne i geometri, men også have kreativitet til at gå hen imod svaret.

"At bevise teoremer viser beherskelsen af ​​logisk ræsonnement ... hvilket betyder en bemærkelsesværdig problemløsningsevne," holdet skrev i forskning offentliggjort i dag i Natur.

Det er her AlphaGeometrys arkitektur udmærker sig. Døbt et neuro-symbolsk system, løser den først et problem med dens symbolske deduktionsmotor. Forestil dig disse algoritmer som en klasse A-elev, der nøje studerer matematiklærebøger og følger regler. De er styret af logik og kan nemt udlægge hvert trin, der fører til en løsning - som at forklare en tankegang i en matematikprøve.

Disse systemer er old school, men utrolig kraftfulde, idet de ikke har det "black box" problem, der hjemsøger meget af moderne deep learning algoritmer.

Dyb læring har omformet vores verden. Men på grund af hvordan disse algoritmer fungerer, kan de ofte ikke forklare deres output. Dette duer bare ikke, når det kommer til matematik, som er afhængig af strenge logiske ræsonnementer, der kan skrives ned.

Symbolske deduktionsmotorer modvirker black box-problemet ved, at de er rationelle og forklarelige. Men stillet over for komplekse problemer er de langsomme og har svært ved at tilpasse sig fleksibelt.

Det er her, store sprogmodeller kommer ind. Drivkraften bag ChatGPT, disse algoritmer er fremragende til at finde mønstre i komplicerede data og generere nye løsninger, hvis der er nok træningsdata. Men de mangler ofte evnen til at forklare sig selv, hvilket gør det nødvendigt at dobbelttjekke deres resultater.

AlphaGeometry kombinerer det bedste fra begge verdener.

Når man står over for et geometriproblem, giver den symbolske deduktionsmotor det en chance først. Tag trekantsproblemet. Algoritmen "forstår" præmissen for spørgsmålet, idet den skal bevise, at de to nederste vinkler er de samme. Sprogmodellen foreslår derefter at tegne en ny linje fra toppen af ​​trekanten lige ned til bunden for at hjælpe med at løse problemet. Hvert nyt element, der flytter AI mod løsningen, kaldes en "konstruktion".

Den symbolske deduktionsmotor tager rådet og skriver logikken bag dens ræsonnement ned. Hvis konstruktionen ikke virker, gennemgår de to systemer flere overvejelser, indtil AlphaGeometry når løsningen.

Hele opsætningen er "beslægtet med ideen om 'at tænke, hurtigt og langsomt'" skrev holdet på DeepMinds blog. "Det ene system giver hurtige, 'intuitive' ideer, og det andet, mere bevidst, rationel beslutningstagning."

Vi er mestrene

I modsætning til tekst- eller lydfiler er der en mangel på eksempler fokuseret på geometri, hvilket gjorde det vanskeligt at træne AlphaGeometry.

Som en løsning genererede teamet deres eget datasæt med 100 millioner syntetiske eksempler på tilfældige geometriske former og kortlagte relationer mellem punkter og linjer - svarende til hvordan du løser geometri i matematiktimer, men i en langt større skala.

Derfra fattede AI'en regler for geometri og lærte at arbejde baglæns fra løsningen for at finde ud af, om det var nødvendigt at tilføje nogen konstruktioner. Denne cyklus gjorde det muligt for AI at lære fra bunden uden menneskelig input.

Holdet satte AI'en på prøve og udfordrede den med 30 Olympiade-problemer fra mere end ti års tidligere konkurrencer. De genererede resultater blev evalueret af en tidligere Olympiade-guldvinder, Evan Chen, for at sikre deres kvalitet.

I alt matchede AI præstationerne fra tidligere guldmedaljevindere, og fuldførte 25 problemer inden for tidsfristen. Det tidligere state-of-the-art resultat var 10 rigtige svar.

"AlphaGeometrys output er imponerende, fordi det er både verificerbart og rent," Chen sagde. "Den bruger klassiske geometriregler med vinkler og lignende trekanter, ligesom eleverne gør."

Ud over matematik

AlphaGeometry er DeepMinds seneste indtog i matematik. I 2021, knækkede deres AI matematiske gåder, der havde ramt mennesker i årtier. For nylig, de brugte store sprogmodeller til at begrunde STEM-problemer på højskoleniveau og revnet et tidligere "uløseligt" matematikproblem baseret på et kortspil med algoritmen FunSearch.

Indtil videre er AlphaGeometry skræddersyet til geometri og med forbehold. Meget af geometrien er visuel, men systemet kan ikke "se" tegningerne, hvilket kan fremskynde problemløsningen. Tilføjelse af billeder, måske med Googles Gemini AI, der blev lanceret i slutningen af ​​sidste år, kan styrke dets geometriske smarte.

En lignende strategi kunne også udvide AlphaGeometrys rækkevidde til en bred vifte af videnskabelige domæner, der kræver stringent ræsonnement med et strejf af kreativitet. (Lad os være rigtige - det er dem alle sammen.)

"I betragtning af det bredere potentiale ved at træne AI-systemer fra bunden med store syntetiske data, kan denne tilgang forme, hvordan fremtidens AI-systemer opdager ny viden, inden for matematik og videre," skrev teamet.

Billede Credit: Joel Filipe / Unsplash 

Tidsstempel:

Mere fra Singularitet Hub