Aplicarea Chain-of-Thought la gândirea umană îmbunătățită de IA - Ross Dawson

Aplicarea lanțului de gândire la gândirea umană îmbunătățită de IA – Ross Dawson

Nodul sursă: 3070889

Printre cele mai importante inovații recente pentru îmbunătățirea valorii și fiabilității modelelor de limbaj mari se numără Lanțul-Gândirii și derivatele sale inclusiv Arborele-Gândirii și Graficul-gândirii

Aceste structuri sunt, de asemenea, extrem de valoroase în proiectarea eficientă Fluxuri de lucru umane + AI pentru o gândire mai bună.

În acest articol, voi oferi o vedere la nivel înalt a Lanțului Gândirii și apoi voi analiza aplicațiile pentru Inteligență umană sporită de AI.

Lanțul-Gândirii

Modelele de limbaj mari (LLM) sunt în general excelente la generarea de text, dar slabe la orice sarcini care implică raționament secvenţial.

Lucrarea de referință din ianuarie 2022 Îndemnarea în lanț de gândire provoacă raționament în modelele de limbaj mari a prezentat modul în care un lanț de gândire – „o serie de pași intermediari de raționament” – ar putea îmbunătăți substanțial performanța LLM la sarcini de raționament, inclusiv puzzle-uri de matematică și bun simț.

Probabil ați văzut această imagine din hârtia făcând tururile.

Acest concept a fost rapid adaptat altor aplicații, inclusiv raționamentul temporal, modele de limbaj vizual, raționament augmentat de recuperareși multe alte modalități de îmbunătățire a performanței modelelor AI.

Lanțul de gândire s-a dovedit deosebit de valoros în aplicațiile practice de rezolvare a problemelor. Exemplele evidente includ medicină, drept, și educaţie

PaLM și Med-PaLM de la Google încorporează structuri de lanț de gândire, iar GPT-4 de la OpenAI, ceea ce înseamnă că atunci când utilizați un LLM, aceste abordări sunt deja încorporate. 

Chiar și așa, celebrul prompt-ul „Să rezolvăm acest lucru pas cu pas pentru a ne asigura că avem răspunsul corect” sau variante ale acestui lucru oferi cea mai bună performanță LLM pentru multe tipuri de sarcini. 

Evoluția lanțului de gândire

O serie de inovații au apărut prin construirea pe Chain-of-Thought.

Procesele eficiente de raționament nu urmează neapărat o singură traiectorie. Asta duce la Arborele-Gândirii structuri, descrise în Arborele gândurilor: Rezolvarea deliberată a problemelor cu modele lingvistice mari.

După cum se arată în această diagramă din lucrare, Chain-of-Thought poate progresa mai întâi la selectarea celei mai frecvente căi din mai multe rezultate și apoi selectarea dintre cele mai bune dintre mai multe căi prin procesul de gândire. 

Evoluțiile mai recente despre Chain-of-Thought includ cele foarte promițătoare Graficul-gândirii precum și Hipergraf-de-Gândire

Structurile noi de „gândire” vor fi esențiale pentru progresul generativ al IA 

Lanțul de gândire și tehnicile conexe au fost create pentru a aborda limitările LLM-urilor și pentru a le îmbunătăți capacitățile. 

Progresul continuu al modelelor AI generative se va baza mult mai mult pe aceste tipuri de tehnici de gândire structurată decât pe capacitatea de calcul sau pe dimensiunea modelului. Aceste abordări au fost deja activate LLM-uri mici și eficiente pentru a obține performanță care se poate apropia de cel al celor mai mari modele. 

Chain-of-Thought și modele similare duc, de asemenea, direct la lanțuri multi-agenți, în care lanțurile sau rețelele de gândire sunt așezate pe mai multe modele optimizate pentru sarcini pentru a crea raționamente și rezultate mult superioare decât pot fi obținute într-un singur model.

Inteligența sporită este mai importantă decât Inteligența Generală Artificială

„Tehnologia nu ar trebui să urmărească înlocuirea oamenilor, mai degrabă amplificarea capacităților umane.” — Doug Engelbart

Forța motrice din spatele aproape a dezvoltării AI pare să fie crearea de mașini care pot emula și pot depăși inteligența și capacitățile umane.

Aceasta este o ambiție de înțeles.

Dar sunt mult, mult mai interesat cum AI poate crește inteligența umană.

Putem lucra pe ambele domenii simultan.

Dar în fiecare scenariu posibil de progres către Inteligența Generală Artificială, ne va fi mai bine dacă am depune cel puțin aceeași energie în construirea, învățarea și aplicarea structurilor de gândire Human + AI.

Fluxuri de lucru pentru oameni + AI 

Conceptul de Oameni + IA este în centrul muncii mele.

Cadrul de mai jos pe care l-am creat acum un an arată încadrarea mea timpurie a „Fluxuri de lucru umane + AI„, în care oamenii și AI se adresează secvenţial sarcinilor cărora li se potrivesc cel mai bine.

Dacă este bine conceput, acest lucru generează inevitabil rezultate superioare celor pe care fiecare ar putea singur. 

De atunci am cercetat mult mai în detaliu care sunt în mod concret cele mai bune structuri de gândire Humans + AI.

Acestea vor fi bazele următoarea fază a inteligenței umane augmentate.

Lanț de gândire pentru gândirea umană îmbunătățită de IA

Conceptele care decurg din Chain-of-Thought au fost dezvoltate pentru a îmbunătăți capacitățile de sine stătătoare ale LLM-urilor.

Cu toate acestea, ele se dovedesc a fi extrem de valoroase în maximizarea valorii oamenilor și AI care lucrează împreună. 

Există o gamă de tehnici de aplicare a structurilor Chain-of-Thought la fluxurile de lucru de gândire umane + AI.

Concepte AI aplicate inteligenței augmentate

LLM-urile pot fi folosite pentru a sugera modul în care sarcinile pot fi descompuse în elemente secvențiale (sau în rețea), fie oamenii, fie AI identificând unde capabilitățile umane sau AI pot fi cele mai potrivite.

O abordare specifică este descrisă în Omul-în-buclă prin lanțul-gândirii, în care „corecția manuală a sub-logicilor în rațiuni poate îmbunătăți performanța raționamentului LLM”.

„Încadrarea” obiectivelor, sarcinii și structurii, așa cum se arată în diagrama fluxului de lucru Humans + AI, conduce la calitatea rezultatelor. Acest lucru este de obicei cel mai bine supravegheat de oameni, folosind fluxuri precum AI care propune sau evaluează parametri.

Încorporez aceste abordări și alte abordări într-un set de „Modele de gândire îmbunătățite de AI”.

Mai general, o mare varietate de progrese AI, nu doar Chain-of-Thought, pot fi aplicate extrem de util pentru a crește inteligența umană.  

Intenționez să scriu un articol similar despre aplicarea conceptelor de Retele adversare generative la Inteligența simbiotică om-AI structuri. 

Curs de gândire și luare a deciziilor îmbunătățite prin inteligență artificială

Accentul meu complet în 2024 este modul în care AI poate spori oamenii.

Una dintre activitățile mele centrale este organizarea unui curs regulat de cohortă pe Maven: Gândire și luare a deciziilor îmbunătățite prin inteligență artificială. Consultați linkul pentru mai multe detalii.

Următoarea cohortă începe pe 8 februarie. Ca mulțumire pentru că ați citit până la sfârșitul acestui articol, puteți obține o reducere de 30% folosind cuponul: COTARTICLE 🙂.

Timestamp-ul:

Mai mult de la Rossdawson