Tankeudbredelse: En analog tilgang til kompleks ræsonnement med store sprogmodeller - KDnuggets

Tankeformidling: En analog tilgang til kompleks ræsonnement med store sprogmodeller – KDnuggets

Kildeknude: 2963270

Tankeformidling: En analog tilgang til kompleks ræsonnement med store sprogmodeller

 

Nøgleforsøg

  • Thought Propagation (TP) er en ny metode, der forbedrer de komplekse ræsonnementevner hos Large Language Models (LLM'er).
  • TP udnytter analoge problemer og deres løsninger til at forbedre ræsonnementet i stedet for at få LLM'er til at ræsonnere fra bunden.
  • Eksperimenter på tværs af forskellige opgaver viser, at TP klarer sig væsentligt bedre end baseline-metoder, med forbedringer fra 12 % til 15 %.

TP beder først LLM'er om at foreslå og løse et sæt af analoge problemer, der er relateret til input. Derefter genbruger TP resultaterne af analoge problemer til direkte at give en ny løsning eller udlede en videnintensiv plan for udførelse for at ændre den oprindelige løsning opnået fra bunden.

Alsidigheden og beregningskraften i Large Language Models (LLM'er) er ubestridelige, men de er ikke uden grænser. En af de mest betydningsfulde og konsekvente udfordringer for LLM'er er deres generelle tilgang til problemløsning, bestående af ræsonnement ud fra de første principper for hver ny opgave, du støder på. Dette er problematisk, da det giver mulighed for en høj grad af tilpasningsevne, men også øger sandsynligheden for fejl, især i opgaver, der kræver flertrins-ræsonnement.

Udfordringen med at "ræsonnere fra bunden" er især udtalt i komplekse opgaver, der kræver flere trin af logik og slutninger. For eksempel, hvis en LLM bliver bedt om at finde den korteste vej i et netværk af sammenkoblede punkter, vil den typisk ikke udnytte forudgående viden eller analoge problemer til at finde en løsning. I stedet ville den forsøge at løse problemet isoleret, hvilket kan føre til suboptimale resultater eller endda direkte fejl. Gå ind Tankeformidling (TP), en metode designet til at øge LLM'ers ræsonnementevner. TP sigter mod at overvinde de iboende begrænsninger ved LLM'er ved at lade dem trække fra et reservoir af analoge problemer og deres tilsvarende løsninger. Denne innovative tilgang forbedrer ikke kun nøjagtigheden af ​​LLM-genererede løsninger, men forbedrer også betydeligt deres evne til at håndtere komplekse ræsonnementopgaver i flere trin. Ved at udnytte kraften i analogien giver TP en ramme, der forstærker LLM'ernes medfødte ræsonnementevner, hvilket bringer os et skridt tættere på realiseringen af ​​virkelig intelligente kunstige systemer.

Tankeformidling involverer to hovedtrin:

  1. For det første bliver LLM bedt om at foreslå og løse et sæt analoge problemer relateret til inputproblemet
  2. Dernæst bruges løsningerne på disse analoge problemer til enten direkte at give en ny løsning eller til at ændre den oprindelige løsning

Processen med at identificere analoge problemer gør det muligt for LLM at genbruge problemløsningsstrategier og -løsninger og derved forbedre sine ræsonnementer. TP er kompatibel med eksisterende promptemetoder, hvilket giver en generaliserbar løsning, der kan inkorporeres i forskellige opgaver uden væsentlig opgavespecifik ingeniørarbejde.

 

Tankeformeringsproces
Figur 1: Tankeformidlingsprocessen (billede fra papir)
 

Desuden bør tilpasningsevnen af ​​TP ikke undervurderes. Dens kompatibilitet med eksisterende promptemetoder gør det til et meget alsidigt værktøj. Det betyder, at TP ikke er begrænset til nogen specifik form for problemløsningsdomæne. Dette åbner op for spændende muligheder for opgavespecifik finjustering og optimering og øger derved nytten og effektiviteten af ​​LLM'er i et bredt spektrum af applikationer.

Implementeringen af ​​Thought Propagation kan integreres i arbejdsgangen for eksisterende LLM'er. For eksempel, i en Shortest-path Reasoning-opgave, kunne TP først løse et sæt enklere, analoge problemer for at forstå forskellige mulige veje. Den ville så bruge disse indsigter til at løse det komplekse problem og derved øge sandsynligheden for at finde den optimale løsning.

 
Eksempel 1

  • Opgaver: Korteste vej Begrundelse
  • Analoge problemer: Korteste vej mellem punkt A og B, Korteste vej mellem punkt B og C
  • Endelig løsning: Optimal vej fra punkt A til C i betragtning af løsninger af analoge problemer

 
Eksempel 2

  • Opgaver: Kreativ skrivning
  • Analoge problemer: Skriv en novelle om venskab, Skriv en novelle om tillid
  • Endelig løsning: Skriv en kompleks novelle, der integrerer temaer om venskab og tillid

 
Processen involverer først at løse disse analoge problemer og derefter bruge den opnåede indsigt til at tackle den komplekse opgave. Denne metode har demonstreret sin effektivitet på tværs af flere opgaver og viser væsentlige forbedringer i præstationsmålinger.

Thought Propagation's implikationer rækker ud over blot at forbedre eksisterende metrics. Denne promptteknik har potentialet til at ændre, hvordan vi forstår og implementerer LLM'er. Metoden understreger et skift fra isoleret, atomisk problemløsning til en mere holistisk, indbyrdes forbundne tilgang. Det får os til at overveje, hvordan LLM'er ikke kun kan lære af data, men fra selve problemløsningsprocessen. Ved løbende at opdatere deres forståelse gennem løsninger på analoge problemer, er LLM'er udstyret med TP bedre forberedt til at tackle uforudsete udfordringer, hvilket gør dem mere modstandsdygtige og tilpasningsdygtige i hurtigt udviklende miljøer.

Tankeudbredelse er en lovende tilføjelse til værktøjskassen med promptmetoder, der sigter mod at forbedre LLM'ers muligheder. Ved at tillade LLM'er at udnytte analoge problemer og deres løsninger, giver TP en mere nuanceret og effektiv ræsonnement metode. Eksperimenter bekræfter dens effektivitet, hvilket gør den til en kandidatstrategi til at forbedre ydeevnen af ​​LLM'er på tværs af en række opgaver. TP kan i sidste ende repræsentere et væsentligt skridt fremad i søgen efter mere dygtige AI-systemer.
 
 

Matthew Mayo (@mattmayo13) har en kandidatgrad i datalogi og en diplomuddannelse i data mining. Som chefredaktør for KDnuggets sigter Matthew efter at gøre komplekse datavidenskabelige koncepter tilgængelige. Hans professionelle interesser omfatter naturlig sprogbehandling, maskinlæringsalgoritmer og udforskning af nye AI. Han er drevet af en mission om at demokratisere viden i datavidenskabssamfundet. Matthew har kodet siden han var 6 år gammel.

Tidsstempel:

Mere fra KDnuggets