Skapa verkligt värde med LLMs

Skapa verkligt värde med LLMs

Källnod: 2906364

I mitten av 2023 vimlar datorvärlden av spänning över framväxten av stora språkmodeller (LLM) som GPT4/ChatGPT premium och StarChat. Att förstå vad dessa modeller kan och inte kan göra och hur man framgångsrikt kan tillämpa dem för affärsfördelar är inte enkelt. Det är viktigt att analysera den framväxande forskningen om egenskaperna hos nuvarande generations LLM och beskriva de strategier som måste antas om de ska kunna tillämpas framgångsrikt. 

LLM:er är speciella eftersom de avger språk som svar på språk; om modellen stimuleras med någon text, producerar den relevant text som ett svar. Detta innebär att det är lätt för alla att interagera med alla LLM som de har ett gränssnitt till, och många LLM har gjorts offentligt tillgängliga via chattgränssnitt. På grund av detta har utvecklingen av LLMs som en AI-teknik haft en plötslig och betydande inverkan på allmänhetens uppfattning om AI-kapaciteten. 
 
Förstå LLMs 

 Det enda som LLM gör är att konsumera text och producera text, men eftersom textgenereringen är så bra verkar modellerna resonera kring och förstå texten de manipulerar. Många människor som arbetar med naturligt språk och AI-forskning har arbetat hårt för att förstå och undersöka LLM-kapacitet. Det finns en växande litteratur som identifierar begränsningarna hos den nuvarande generationen av modeller och visar att kanske den initiala spänningen som mötte dem borde dämpas. Det är viktigt att avrunda den nuvarande listan över begränsningar till toppmoderna LLM:er och att utvärdera både betydelsen av dessa och sannolikheten för att de visar sig vara grundläggande brister hos LLM:er som ett förhållningssätt till AI. I annat arbete kartläggs några av de tekniska begränsningarna för LLM.  

Jag har dock tittat på validerade begränsningar med några enkla exempel på aktuellt LLM-beteende och analyserat icke-tekniska begränsningar som säkerhet och immateriella rättigheter. Efter att ha granskat teknikens begränsningar kan du sedan undersöka hur tekniken kan tillämpas framgångsrikt och vad företag bör fokusera på, för att generera maximalt värde av den möjlighet som LLM-revolutionen skapar. 

En väg till framgång 

En väg till framgång kan definieras för organisationer som vill få tillgång till det otvivelaktiga värdet av den nya generationen LLM, samtidigt som de hanterar risken från deras identifierade svagheter. Denna väg till framgång ligger mellan att begränsa LLM:ers användning till komponenter som levererar väl specificerad och kontrollerad funktionalitet, för att integrera dem i lämpliga infrastrukturer för kontroll och ansvarighet. 

Det är möjligt att framtida LLM:er kan lösa de problem som för närvarande förhindrar obegränsad användning av denna nya generation av modeller. Till exempel kan LLM mycket väl konstrueras om (utöver nuvarande transformatorer) för att planera effektivt inom en relativt nära framtid. Tekniskt sett verkar det inte finnas någon grundläggande anledning till att detta inte kan göras, även om det säkerligen kommer att kräva ytterligare en häpnadsväckande investering i datorkraft.  

Andra begränsningar, som att hantera kompositionsresonemang, papegoj och säkerhet verkar mer svårlösta. Oavsett fortsatta framsteg är det värt att tänka på att mycket enklare, mogna och förutsägbara tekniker som e-post, databaser och webbläsare fortfarande kräver sofistikerade applikationsmönster och hanteringskontroller. Det verkar osannolikt att LLM kommer att visa sig vara annorlunda. 

Det naturliga språkgränssnittet som demonstreras av många av den senaste generationens LLM:er har väckt en mycket bredare befolkning till kraften hos LLM:er i synnerhet, och AI mer generellt. Som sådana har vi identifierat några av de viktigaste begränsningarna för sådana tillvägagångssätt och samtidigt gett rekommendationer för implementeringar som kan mildra några av dessa problem, vilket i slutändan möjliggör ett framgångsrikt antagande av LLM. Det måste dock noteras att inget av detta tar bort behovet av vision, investeringar och ett skickligt team för att implementera sådana lösningar. 

Tidsstämpel:

Mer från Fintextra