Noua inteligență artificială Google DeepMind se potrivește cu performanța cu medalia de aur la Olimpiada de matematică

Noua inteligență artificială Google DeepMind se potrivește cu performanța cu medalia de aur la Olimpiada de matematică

Nodul sursă: 3067930

După spargerea unei matematici de nerezolvat problema anul trecut, AI a revenit pentru a aborda geometria.

Dezvoltat de Google DeepMind, un nou algoritm, AlphaGeometry, poate zdrobi problemele de la olimpiadele internaționale de matematică anterioare — o competiție de nivel înalt pentru liceeni — și se potrivește cu performanța medaliilor de aur anteriori.

Când a fost contestat cu 30 de probleme de geometrie dificile, AI a rezolvat cu succes 25 în timpul standard alocat, depășind algoritmii anteriori de ultimă generație cu 15 răspunsuri.

Deși este adesea considerată nenorocirea orelor de matematică din liceu, geometria este încorporată în viața noastră de zi cu zi. Arta, astronomia, designul interior și arhitectura se bazează toate pe geometrie. La fel și navigația, hărțile și planificarea rutelor. În esență, geometria este o modalitate de a descrie spațiul, formele și distanțele folosind raționamentul logic.

Într-un fel, rezolvarea problemelor de geometrie este un pic ca a juca șah. Având în vedere unele reguli – numite teoreme și dovezi – există un număr limitat de soluții pentru fiecare pas, dar găsirea careia are sens se bazează pe un raționament flexibil care se conformează regulilor matematice stricte.

Cu alte cuvinte, abordarea geometriei necesită atât creativitate, cât și structură. În timp ce oamenii își dezvoltă aceste abilități mentale acrobatice prin ani de practică, AI s-a luptat întotdeauna.

AlphaGeometry combină inteligent ambele caracteristici într-un singur sistem. Are două componente principale: un model logic legat de reguli care încearcă să găsească un răspuns și un model de limbaj mare pentru a genera idei ieșite din cutie. Dacă AI nu reușește să găsească o soluție bazată doar pe raționament logic, modelul de limbaj intervine pentru a oferi noi unghiuri. Rezultatul este o IA cu creativitate și abilități de raționament care poate explica soluția sa.

Sistemul este cea mai recentă incursiune a DeepMind în rezolvarea problemelor matematice cu inteligența mașinilor. Dar ochii lor sunt pe un premiu mai mare. AlphaGeometry este construit pentru raționamentul logic în medii complexe, cum ar fi lumea noastră haotică de zi cu zi. Dincolo de matematică, iterațiile viitoare ar putea ajuta oamenii de știință să găsească soluții în alte sisteme complicate, cum ar fi descifrarea conexiunilor creierului sau desfacerea rețelelor genetice care duc la boli.

„Facem un salt mare, un progres mare în ceea ce privește rezultatul”, autorul studiului, dr. Trieu Trinh a spus il New York Times.

Echipa dublă

O întrebare rapidă de geometrie: Imaginează-ți un triunghi cu ambele laturi egale în lungime. Cum demonstrezi că cele două unghiuri de jos sunt exact aceleași?

Aceasta este una dintre primele provocări cu care s-a confruntat AlphaGeometry. Pentru a o rezolva, trebuie să înțelegeți pe deplin regulile din geometrie, dar și să aveți creativitate pentru a ajunge la răspuns.

„Demonstrarea teoremelor demonstrează stăpânirea raționamentului logic... ceea ce înseamnă o abilitate remarcabilă de rezolvare a problemelor”, a spus echipa a scris într-o cercetare publicată astăzi în Natură.

Aici excelează arhitectura AlphaGeometry. Dublat un sistem neuro-simbolic, abordează mai întâi o problemă cu motorul său de deducție simbolică. Imaginați-vă acești algoritmi ca un elev de clasa A care studiază strict manualele de matematică și respectă regulile. Ei sunt ghidați de logică și pot prezenta cu ușurință fiecare pas care duce la o soluție, cum ar fi explicarea unei linii de raționament într-un test de matematică.

Aceste sisteme sunt vechi, dar incredibil de puternice, prin faptul că nu au problema „cutiei negre” care bântuie o mare parte din algoritmii moderni de învățare profundă.

Învățarea profundă a remodelat lumea noastră. Dar, din cauza modului în care acești algoritmi funcționează, adesea nu își pot explica rezultatul. Acest lucru pur și simplu nu se va descurca atunci când vine vorba de matematică, care se bazează pe un raționament logic strict care poate fi notat.

Motoarele de deducție simbolică contracarează problema cutiei negre prin faptul că sunt raționale și explicabile. Dar se confruntă cu probleme complexe, sunt lenți și se luptă să se adapteze în mod flexibil.

Aici intervin modelele mari de limbă. Forța motrice din spatele ChatGPT, acești algoritmi sunt excelenți în găsirea de modele în date complicate și pentru a genera soluții noi, dacă există suficiente date de antrenament. Dar adesea le lipsește capacitatea de a se explica, ceea ce face necesară verificarea rezultatelor.

AlphaGeometry combină tot ce este mai bun din ambele lumi.

Când se confruntă cu o problemă de geometrie, motorul deducției simbolice îi dă o încercare mai întâi. Luați problema triunghiului. Algoritmul „înțelege” premisa întrebării, prin aceea că trebuie să demonstreze că cele două unghiuri de jos sunt aceleași. Modelul lingvistic sugerează apoi trasarea unei noi linii din partea de sus a triunghiului drept în jos până în jos pentru a ajuta la rezolvarea problemei. Fiecare element nou care mută AI către soluție este numit „construct”.

Motorul deducției simbolice preia sfatul și notează logica din spatele raționamentului său. Dacă construcția nu funcționează, cele două sisteme trec prin mai multe runde de deliberare până când AlphaGeometry ajunge la soluție.

Întreaga configurație este „asemănătoare cu ideea de „gândire, rapid și lent”” scris echipa de pe blogul lui DeepMind. „Un sistem oferă idei rapide, „intuitive”, iar celălalt, luarea deciziilor mai deliberate și raționale.”

Noi suntem campioni

Spre deosebire de fișierele text sau audio, există o lipsă de exemple axate pe geometrie, ceea ce a făcut dificilă antrenarea AlphaGeometry.

Ca o soluție, echipa și-a generat propriul set de date cu 100 de milioane de exemple sintetice de forme geometrice aleatorii și relații mapate între puncte și linii - similar cu modul în care rezolvați geometria la cursul de matematică, dar la o scară mult mai mare.

De acolo, AI a înțeles regulile de geometrie și a învățat să lucreze înapoi de la soluție pentru a-și da seama dacă trebuie să adauge vreo construcție. Acest ciclu a permis AI să învețe de la zero fără nicio intervenție umană.

Punând AI la încercare, echipa a contestat-o ​​cu 30 de probleme la olimpiade din peste un deceniu de competiții anterioare. Rezultatele generate au fost evaluate de un precedent medaliat cu aur la olimpiade, Evan Chen, pentru a le asigura calitatea.

În total, AI a egalat performanța medaliilor de aur din trecut, completând 25 de probleme în timpul limită. The rezultatul anterior de ultimă generație au fost 10 răspunsuri corecte.

„Ieșirea AlphaGeometry este impresionantă pentru că este atât verificabilă, cât și curată”, Chen a spus. „Folosește regulile de geometrie clasică cu unghiuri și triunghiuri similare, așa cum fac elevii.”

Dincolo de matematică

AlphaGeometry este cea mai recentă incursiune a DeepMind în matematică. în 2021, inteligența lor a rezolvat puzzle-uri matematice care i-au uimit pe oameni de zeci de ani. Mai recent, ei au folosit modele mari de limbaj pentru a raționa problemele STEM la nivel de facultate și crăpat o problemă de matematică „nerezolvabilă” anterior bazată pe un joc de cărți cu algoritmul FunSearch.

Deocamdată, AlphaGeometry este adaptată geometriei și cu avertismente. O mare parte din geometrie este vizuală, dar sistemul nu poate „vedea” desenele, ceea ce ar putea accelera rezolvarea problemelor. Adăugarea de imagini, poate cu Gemini AI de la Google, lansat la sfârșitul anului trecut, își poate consolida inteligența geometrică.

O strategie similară ar putea extinde, de asemenea, raza AlphaGeometry la o gamă largă de domenii științifice care necesită un raționament strict, cu un strop de creativitate. (Să fim realiști - sunt toate.)

„Având în vedere potențialul mai larg al antrenării sistemelor AI de la zero cu date sintetice la scară largă, această abordare ar putea modela modul în care sistemele AI ale viitorului descoperă noi cunoștințe, în matematică și nu numai”, a scris echipa.

Credit imagine: Joel Filipe / Unsplash 

Timestamp-ul:

Mai mult de la Singularity Hub