Skape reell verdi med LLM-er

Skape reell verdi med LLM-er

Kilde node: 2906364

I midten av 2023 yrer dataverdenen av spenning over fremveksten av store språkmodeller (LLM) som GPT4/ChatGPT premium og StarChat. Det er ikke enkelt å forstå hva disse modellene kan og ikke kan gjøre, og hvordan man kan bruke dem til forretningsfordeler. Det er viktig å analysere den nye forskningen på egenskapene til nåværende generasjons LLM-er og skissere strategiene som må tas i bruk hvis de skal bli vellykket brukt. 

LLM-er er spesielle fordi de avgir språk som svar på språk; hvis modellen stimuleres med noe tekst, produserer den relevant tekst som respons. Dette betyr at det er enkelt for alle å samhandle med et hvilket som helst LLM som de har et grensesnitt til, og mange LLM-er har blitt gjort offentlig tilgjengelig gjennom chat-grensesnitt. På grunn av dette har utviklingen av LLM-er som en AI-teknologi hatt en plutselig og betydelig innvirkning på den offentlige oppfatningen av evnene til AI. 
 
Forstå LLM-er 

 Det eneste LLM-er gjør er å konsumere tekst og produsere tekst, men fordi tekstgenereringen er så god, ser det ut til at modellene resonnerer om og forstår teksten de manipulerer. Mange mennesker som jobber med naturlig språk og AI-forskning har jobbet hardt for å forstå og undersøke LLM-evner. Det er en voksende litteratur som identifiserer begrensningene til den nåværende generasjonen av modeller og viser at kanskje den første spenningen som møtte dem burde dempes. Det er viktig å avrunde den nåværende listen over begrensninger til toppmoderne LLM-er og å vurdere både betydningen av disse og sannsynligheten for at de viser seg å være grunnleggende feil ved LLM-er som en tilnærming til AI. I annet arbeid kartlegges noen av de tekniske begrensningene til LLM.  

Jeg har imidlertid sett på validerte begrensninger med noen enkle eksempler på gjeldende LLM-atferd og analysert ikke-tekniske begrensninger som sikkerhet og immaterielle problemer. Etter å ha gjennomgått begrensningene til teknologien, kan du undersøke hvordan teknologien kan brukes med suksess og hva bedrifter bør fokusere på, for å generere maksimal verdi ut av muligheten som LLM-revolusjonen skaper. 

En vei til suksess 

En vei til suksess kan defineres for organisasjoner som ønsker å få tilgang til den utvilsomme verdien av den nye generasjonen av LLM-er, mens de håndterer risikoen fra deres identifiserte svakheter. Denne veien til suksess ligger mellom å begrense LLMs bruk til komponenter som leverer velspesifisert og kontrollert funksjonalitet, for å bygge dem inn i passende infrastrukturer for kontroll og ansvarlighet. 

Det er mulig at fremtidige LLM-er kan løse problemene som for øyeblikket forhindrer ubegrenset bruk av denne nye generasjonen av modeller. For eksempel kan LLM-er godt konstrueres på nytt (utover nåværende transformatorer) for å planlegge effektivt i relativt nær fremtid. Teknisk sett ser det ikke ut til å være en grunnleggende grunn til at dette ikke lar seg gjøre, selv om det helt sikkert vil kreve nok en forbløffende investering i datakraft.  

Andre begrensninger, som å håndtere komposisjonelle resonnementer, papegøye og sikkerhet virker mer uoverkommelige. Uavhengig av stadige fremskritt, er det verdt å vurdere at langt enklere, modne og forutsigbare teknologier som e-post, databaser og nettlesere fortsatt krever sofistikerte applikasjonsmønstre og administrasjonskontroller. Det virker usannsynlig at LLM-er vil vise seg å være annerledes. 

Det naturlige språkgrensesnittet demonstrert av mange av den siste generasjonen av LLM-er har vekket en mye bredere befolkning til kraften til LLM-er spesielt, og AI mer generelt. Som sådan har vi identifisert noen av hovedbegrensningene ved slike tilnærminger, og samtidig kommet med anbefalinger for implementeringer som kan redusere noen av disse problemene, og til slutt muliggjøre vellykket bruk av LLM. Det må imidlertid bemerkes at ingenting av dette fjerner behovet for visjon, investering og et dyktig team for å implementere slike løsninger. 

Tidstempel:

Mer fra Fintextra