Google DeepMinds nye AI matcher gullmedaljeprestasjonene i matte-OL

Google DeepMinds nye AI matcher gullmedaljeprestasjonene i matte-OL

Kilde node: 3067930

Etter knekke en uløselig matematikk problemet i fjor, AI er tilbake for å takle geometri.

Utviklet av Google DeepMind, en ny algoritme, AlphaGeometry, kan knuse problemer fra tidligere internasjonale matematiske olympiader – en konkurranse på toppnivå for videregående skoleelever – og matcher resultatene til tidligere gullmedaljevinnere.

Da den ble utfordret med 30 vanskelige geometriproblemer, løste AI 25 med suksess innen standard tildelt tid, og slo tidligere toppmoderne algoritmer med 15 svar.

Selv om geometri ofte betraktes som en bane i matematikktimene på videregående skole, er geometri integrert i hverdagen vår. Kunst, astronomi, interiørdesign og arkitektur er avhengig av geometri. Det samme gjør navigasjon, kart og ruteplanlegging. I kjernen er geometri en måte å beskrive rom, former og avstander ved å bruke logisk resonnement.

På en måte er det å løse geometriproblemer litt som å spille sjakk. Gitt noen regler - kalt teoremer og bevis - er det et begrenset antall løsninger for hvert trinn, men å finne hvilken som er fornuftig, er avhengig av fleksibel resonnement i samsvar med strenge matematiske regler.

Å takle geometri krever med andre ord både kreativitet og struktur. Mens mennesker utvikler disse mentale akrobatiske ferdighetene gjennom år med praksis, har AI alltid slitt.

AlphaGeometry kombinerer begge funksjonene på en smart måte i ett enkelt system. Den har to hovedkomponenter: En regelbundet logisk modell som prøver å finne et svar, og en stor språkmodell for å generere ut-av-boksen ideer. Hvis AI ikke klarer å finne en løsning basert på logisk resonnement alene, starter språkmodellen for å gi nye vinkler. Resultatet er en kunstig intelligens med både kreativitet og resonnementferdigheter som kan forklare løsningen.

Systemet er DeepMinds siste forsøk på å løse matematiske problemer med maskinintelligens. Men øynene deres er rettet mot en større premie. AlphaGeometry er bygget for logiske resonnementer i komplekse miljøer – slik som vår kaotiske hverdagsverden. Utover matematikk kan fremtidige iterasjoner potensielt hjelpe forskere med å finne løsninger i andre kompliserte systemer, for eksempel å tyde hjerneforbindelser eller nøste opp genetiske nett som fører til sykdom.

"Vi gjør et stort hopp, et stort gjennombrudd når det gjelder resultatet," studieforfatter Dr. Trieu Trinh fortalte de New York Times.

Double Team

Et raskt geometrispørsmål: Se for deg en trekant med begge sider like lange. Hvordan beviser du at de to nederste vinklene er nøyaktig like?

Dette er en av de første utfordringene AlphaGeometry møtte. For å løse det, må du forstå regler i geometri fullt ut, men også ha kreativitet til å gå mot svaret.

"Å bevise teoremer viser mestring av logisk resonnement ... betyr en bemerkelsesverdig problemløsningsevne," teamet skrev i forskning publisert i dag i Natur.

Det er her AlphaGeometrys arkitektur utmerker seg. Dubbet et nevro-symbolsk system, takler den først et problem med sin symbolske deduksjonsmotor. Se for deg disse algoritmene som en klasse A-student som studerer matematikk-lærebøker strengt og følger regler. De styres av logikk og kan enkelt legge ut hvert trinn som fører til en løsning – som å forklare et resonnement i en matematikkprøve.

Disse systemene er gamle, men utrolig kraftige, ved at de ikke har "black box"-problemet som hjemsøker mye av moderne dyplæringsalgoritmer.

Dyplæring har omformet vår verden. Men på grunn av hvordan disse algoritmene fungerer, kan de ofte ikke forklare resultatet. Dette vil bare ikke gjøre når det gjelder matematikk, som er avhengig av strenge logiske resonnementer som kan skrives ned.

Symboliske deduksjonsmotorer motvirker black box-problemet ved at de er rasjonelle og forklarbare. Men stilt overfor komplekse problemer er de trege og sliter med å tilpasse seg fleksibelt.

Det er her store språkmodeller kommer inn. Drivkraften bak ChatGPT, disse algoritmene er utmerket til å finne mønstre i kompliserte data og generere nye løsninger, hvis det er nok treningsdata. Men de mangler ofte evnen til å forklare seg selv, noe som gjør det nødvendig å dobbeltsjekke resultatene.

AlphaGeometry kombinerer det beste fra to verdener.

Når du står overfor et geometriproblem, gir den symbolske deduksjonsmotoren en sjanse først. Ta trekantproblemet. Algoritmen "forstår" premisset for spørsmålet, ved at den må bevise at de to nederste vinklene er like. Språkmodellen foreslår da å tegne en ny linje fra toppen av trekanten rett ned til bunnen for å hjelpe til med å løse problemet. Hvert nytt element som beveger AI mot løsningen kalles en "konstruksjon".

Den symbolske deduksjonsmotoren tar rådet og skriver ned logikken bak resonnementet. Hvis konstruksjonen ikke fungerer, går de to systemene gjennom flere runder med overveielse til AlphaGeometry når løsningen.

Hele oppsettet er "beslektet med ideen om å 'tenke, raskt og sakte'" skrev teamet på DeepMinds blogg. "Det ene systemet gir raske, 'intuitive' ideer, og det andre, mer bevisst, rasjonell beslutningstaking."

Vi er vinnerne

I motsetning til tekst- eller lydfiler, er det en mangel på eksempler fokusert på geometri, noe som gjorde det vanskelig å trene AlphaGeometry.

Som en løsning genererte teamet sitt eget datasett med 100 millioner syntetiske eksempler på tilfeldige geometriske former og kartlagte forhold mellom punkter og linjer – lik hvordan du løser geometri i matematikktimen, men i en langt større skala.

Derfra grep AI-reglene for geometri og lærte å jobbe bakover fra løsningen for å finne ut om det var nødvendig å legge til noen konstruksjoner. Denne syklusen tillot AI å lære fra bunnen av uten menneskelig innspill.

Etter å ha satt AI på prøve, utfordret teamet det med 30 Olympiade-problemer fra over et tiår med tidligere konkurranser. De genererte resultatene ble evaluert av en tidligere Olympiad-gullvinner, Evan Chen, for å sikre kvaliteten.

I alt matchet AI ytelsen til tidligere gullmedaljevinnere, og fullførte 25 problemer innen tidsfristen. De tidligere toppmoderne resultat var 10 riktige svar.

"AlphaGeometrys utgang er imponerende fordi den er både kontrollerbar og ren," Chen sa. "Den bruker klassiske geometriregler med vinkler og lignende trekanter akkurat som elevene gjør."

Beyond Math

AlphaGeometry er DeepMinds siste forsøk på matematikk. i 2021, deres AI tok knekken på matematiske gåter som hadde slått mennesker i stykker i flere tiår. Mer nylig, de brukte store språkmodeller for å begrunne STEM-problemer på høyskolenivå og sprukket et tidligere "uløselig" matematisk problem basert på et kortspill med algoritmen FunSearch.

Foreløpig er AlphaGeometry skreddersydd for geometri, og med forbehold. Mye av geometrien er visuell, men systemet kan ikke "se" tegningene, noe som kan fremskynde problemløsningen. Legger til bilder, kanskje med Googles Gemini AI, lansert sent i fjor, kan styrke sin geometriske smarte.

En lignende strategi kan også utvide AlphaGeometrys rekkevidde til et bredt spekter av vitenskapelige domener som krever strenge resonnementer med et snev av kreativitet. (La oss være ekte - det er dem alle sammen.)

"Gitt det bredere potensialet til å trene AI-systemer fra bunnen av med storskala syntetiske data, kan denne tilnærmingen forme hvordan fremtidens AI-systemer oppdager ny kunnskap, i matematikk og utover," skrev teamet.

Bilde Credit: Joel Filipe / Unsplash 

Tidstempel:

Mer fra Singularity Hub