Ustvarjanje prave vrednosti z LLM

Ustvarjanje prave vrednosti z LLM

Izvorno vozlišče: 2906364

Sredi leta 2023 je svet računalništva poln navdušenja nad pojavom velikih jezikovnih modelov (LLM), kot sta GPT4/ChatGPT premium in StarChat. Razumevanje, kaj ti modeli lahko in česa ne morejo ter kako jih uspešno uporabiti za poslovno prednost, ni preprosto. Pomembno je analizirati nastajajoče raziskave o lastnostih sedanje generacije LLM in orisati strategije, ki jih bo treba sprejeti, če jih želimo uspešno uporabiti. 

LLM so posebni, ker oddajajo jezik kot odgovor na jezik; če je model stimuliran z besedilom, proizvede ustrezno besedilo kot odgovor. To pomeni, da je za vsakogar preprosto komunicirati s katerim koli LLM, za katerega ima vmesnik, in veliko LLM je javno dostopnih prek vmesnikov za klepet. Zaradi tega je imel razvoj LLM kot tehnologije umetne inteligence nenaden in pomemben vpliv na javno dojemanje zmogljivosti umetne inteligence. 
 
Razumevanje LLM 

 Edina stvar, ki jo LLM-ji počnejo, je poraba besedila in ustvarjanje besedila, a ker je generiranje besedila tako dobro, se zdi, da modeli razmišljajo o besedilu, s katerim manipulirajo, in ga razumejo. Mnogi ljudje, ki se ukvarjajo z raziskavami naravnega jezika in umetne inteligence, so trdo delali, da bi razumeli in preizkusili zmožnosti LLM. Vse več je literature, ki ugotavlja omejitve sedanje generacije modelov in dokazuje, da bi bilo morda treba umiriti začetno navdušenje, ki jih je sprejelo. Pomembno je zaokrožiti trenutni seznam omejitev najsodobnejših LLM-jev in ovrednotiti njihov pomen in verjetnost, da se bodo izkazale za temeljne pomanjkljivosti LLM-jev kot pristopa k umetni inteligenci. V drugem delu so pregledane nekatere tehnične omejitve LLM.  

Vendar sem si ogledal potrjene omejitve z nekaj preprostimi primeri trenutnega vedenja LLM in analiziral netehnične omejitve, kot so vprašanja varnosti in intelektualne lastnine. Ko pregledate omejitve tehnologije, lahko nato preučite, kako je mogoče tehnologijo uspešno uporabiti in na kaj se morajo podjetja osredotočiti, da ustvarijo največjo vrednost iz priložnosti, ki jo ustvarja revolucija LLM. 

Pot do uspeha 

Pot do uspeha je mogoče opredeliti za organizacije, ki želijo dostopati do nedvomne vrednosti nove generacije LLM-jev, hkrati pa obvladovati tveganje zaradi ugotovljenih slabosti. Ta pot do uspeha je med omejevanjem uporabe LLM-jev na komponente, ki zagotavljajo dobro opredeljeno in nadzorovano funkcionalnost, da se jih vgradi v ustrezne infrastrukture nadzora in odgovornosti. 

Možno je, da bodo prihodnji LLM rešili težave, ki trenutno preprečujejo neomejeno uporabo te nove generacije modelov. LLM-je je na primer mogoče preoblikovati (poleg tokovnih transformatorjev) za učinkovito načrtovanje v razmeroma bližnji prihodnosti. Tehnično se zdi, da ni temeljnega razloga, zakaj tega ni mogoče storiti, čeprav bo to zagotovo zahtevalo še eno osupljivo naložbo v računalniško moč.  

Druge omejitve, kot so obravnavanje kompozicijskega sklepanja, papagajsko ponavljanje in varnost, se zdijo bolj nerešljive. Ne glede na nadaljnji napredek je vredno upoštevati, da veliko enostavnejše, zrelejše in predvidljive tehnologije, kot so e-pošta, baze podatkov in spletni brskalniki, še vedno zahtevajo prefinjene vzorce aplikacij in nadzor upravljanja. Zdi se malo verjetno, da se bodo LLM izkazali za drugačne. 

Vmesnik v naravnem jeziku, ki ga prikazujejo številne najnovejše generacije LLM-jev, je prebudil veliko širšo populacijo o moči LLM-jev, zlasti in AI na splošno. Kot taki smo identificirali nekatere glavne omejitve takih pristopov in hkrati dali priporočila za implementacije, ki lahko ublažijo nekatere od teh težav, kar na koncu omogoči uspešno sprejetje LLM. Vendar je treba opozoriti, da nič od tega ne odpravlja potrebe po viziji, naložbah in usposobljeni ekipi za izvajanje takšnih rešitev. 

Časovni žig:

Več od Fintextra