Skapa verkligt värde med LLMs

Återutgiven av Platon

anhängare: 0

I mitten av 2023 vimlar datorvärlden av spänning över framväxten av stora språkmodeller (LLM) som GPT4/ChatGPT premium och StarChat. Att förstå vad dessa modeller kan och inte kan göra och hur man framgångsrikt kan tillämpa dem för affärsfördelar är inte enkelt. Det är viktigt att analysera den framväxande forskningen om egenskaperna hos nuvarande generations LLM och beskriva de strategier som måste antas om de ska kunna tillämpas framgångsrikt.

LLM:er är speciella eftersom de avger språk som svar på språk; om modellen stimuleras med någon text, producerar den relevant text som ett svar. Detta innebär att det är lätt för alla att interagera med alla LLM som de har ett gränssnitt till, och många LLM har gjorts offentligt tillgängliga via chattgränssnitt. På grund av detta har utvecklingen av LLMs som en AI-teknik haft en plötslig och betydande inverkan på allmänhetens uppfattning om AI-kapaciteten.

Förstå LLMs

Det enda som LLM gör är att konsumera text och producera text, men eftersom textgenereringen är så bra verkar modellerna resonera kring och förstå texten de manipulerar. Många människor som arbetar med naturligt språk och AI-forskning har arbetat hårt för att förstå och undersöka LLM-kapacitet. Det finns en växande litteratur som identifierar begränsningarna hos den nuvarande generationen av modeller och visar att kanske den initiala spänningen som mötte dem borde dämpas. Det är viktigt att avrunda den nuvarande listan över begränsningar till toppmoderna LLM:er och att utvärdera både betydelsen av dessa och sannolikheten för att de visar sig vara grundläggande brister hos LLM:er som ett förhållningssätt till AI. I annat arbete kartläggs några av de tekniska begränsningarna för LLM.

Jag har dock tittat på validerade begränsningar med några enkla exempel på aktuellt LLM-beteende och analyserat icke-tekniska begränsningar som säkerhet och immateriella rättigheter. Efter att ha granskat teknikens begränsningar kan du sedan undersöka hur tekniken kan tillämpas framgångsrikt och vad företag bör fokusera på, för att generera maximalt värde av den möjlighet som LLM-revolutionen skapar.

En väg till framgång

En väg till framgång kan definieras för organisationer som vill få tillgång till det otvivelaktiga värdet av den nya generationen LLM, samtidigt som de hanterar risken från deras identifierade svagheter. Denna väg till framgång ligger mellan att begränsa LLM:ers användning till komponenter som levererar väl specificerad och kontrollerad funktionalitet, för att integrera dem i lämpliga infrastrukturer för kontroll och ansvarighet.

Det är möjligt att framtida LLM:er kan lösa de problem som för närvarande förhindrar obegränsad användning av denna nya generation av modeller. Till exempel kan LLM mycket väl konstrueras om (utöver nuvarande transformatorer) för att planera effektivt inom en relativt nära framtid. Tekniskt sett verkar det inte finnas någon grundläggande anledning till att detta inte kan göras, även om det säkerligen kommer att kräva ytterligare en häpnadsväckande investering i datorkraft.

Andra begränsningar, som att hantera kompositionsresonemang, papegoj och säkerhet verkar mer svårlösta. Oavsett fortsatta framsteg är det värt att tänka på att mycket enklare, mogna och förutsägbara tekniker som e-post, databaser och webbläsare fortfarande kräver sofistikerade applikationsmönster och hanteringskontroller. Det verkar osannolikt att LLM kommer att visa sig vara annorlunda.

Det naturliga språkgränssnittet som demonstreras av många av den senaste generationens LLM:er har väckt en mycket bredare befolkning till kraften hos LLM:er i synnerhet, och AI mer generellt. Som sådana har vi identifierat några av de viktigaste begränsningarna för sådana tillvägagångssätt och samtidigt gett rekommendationer för implementeringar som kan mildra några av dessa problem, vilket i slutändan möjliggör ett framgångsrikt antagande av LLM. Det måste dock noteras att inget av detta tar bort behovet av vision, investeringar och ett skickligt team för att implementera sådana lösningar.

SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
Källa: https://www.finextra.com/blogposting/24963/creating-real-value-with-llms?utm_medium=rssfinextra&utm_source=finextrablogs

Tidsstämpel: September 28, 2023

Mer från Fintextra

Är vi redo för hyperpersonaliseringens ålder? (Matthew Phillips)

Källkluster:

Fintextra

Källnod: 1614554

Tidsstämpel: Augusti 9, 2022

De största företagen för förnybar energi i världen (Konstantin Rabin)

Fintextra

Källnod: 1777072

Tidsstämpel: December 19, 2022

Återutgiven av Platon

Mer från Fintextra

Är vi redo för hyperpersonaliseringens ålder? (Matthew Phillips)

De största företagen för förnybar energi i världen (Konstantin Rabin)

Hur Connected Underwriting förändrar försäkring (Gijsbert Cox)

Kommer inbäddade försäkringar att bli branschens framtid? (René Schoenauer)

3 stora drag inom FinTech som dominerar nyhetsrubriker

Den tysta revolutionen av internationella betalningar (Pierre-Antoine Dusoulier)

Tillståndet för projektledning och vad framtiden bär med artificiell intelligens

Hur kan fintech-företag förbättra sin kundupplevelse?

Hur kan Fintech vinna i Röda havet? Förbättra kundupplevelsen (Koen Vanpraet)

3 GenAI-användningsfall för kapitalmarknader: Vektorns kraft

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto