Tworzenie prawdziwej wartości dzięki LLM

Tworzenie prawdziwej wartości dzięki LLM

Węzeł źródłowy: 2906364

W połowie 2023 r. w świecie informatyki panuje ekscytacja w związku z pojawieniem się dużych modeli językowych (LLM), takich jak GPT4/ChatGPT premium i StarChat. Zrozumienie, co te modele mogą, a czego nie mogą zrobić i jak skutecznie zastosować je w celu uzyskania korzyści biznesowych, nie jest proste. Ważne jest, aby przeanalizować pojawiające się badania nad właściwościami LLM obecnej generacji i nakreślić strategie, które należy przyjąć, aby można je było skutecznie zastosować. 

LLM są wyjątkowe, ponieważ emitują język w odpowiedzi na język; jeśli model jest stymulowany jakimś tekstem, w odpowiedzi generuje odpowiedni tekst. Oznacza to, że każdy może łatwo wchodzić w interakcję z dowolnym LLM, do którego ma interfejs, a wiele LLM zostało udostępnionych publicznie za pośrednictwem interfejsów czatu. Z tego powodu rozwój LLM jako technologii sztucznej inteligencji miał nagły i znaczący wpływ na społeczne postrzeganie możliwości sztucznej inteligencji. 
 
Zrozumienie LLM 

 Jedyną rzeczą, którą robią LLM, jest konsumowanie tekstu i tworzenie tekstu, ale ponieważ generowanie tekstu jest tak dobre, wydaje się, że modele rozumują i rozumieją tekst, którym manipulują. Wiele osób zajmujących się językiem naturalnym i badaniami nad sztuczną inteligencją ciężko pracowało, aby zrozumieć i zbadać możliwości LLM. Coraz liczniejsza literatura wskazuje na ograniczenia obecnej generacji modeli i pokazuje, że być może należy złagodzić początkowe podekscytowanie, jakie je wywołało. Ważne jest, aby podsumować obecną listę ograniczeń najnowocześniejszych LLM i ocenić zarówno ich znaczenie, jak i prawdopodobieństwo, że okażą się one fundamentalnymi wadami LLM jako podejścia do sztucznej inteligencji. W innej pracy zbadano niektóre ograniczenia techniczne LLM.  

Jednakże przyjrzałem się potwierdzonym ograniczeniom na podstawie kilku prostych przykładów bieżącego zachowania LLM i przeanalizowałem ograniczenia nietechniczne, takie jak kwestie bezpieczeństwa i własności intelektualnej. Po zapoznaniu się z ograniczeniami technologii można następnie sprawdzić, w jaki sposób można ją skutecznie zastosować i na czym przedsiębiorstwa powinny się skupić, aby wygenerować maksymalną wartość z możliwości, jakie stwarza rewolucja LLM. 

Droga do sukcesu 

Można zdefiniować ścieżkę do sukcesu dla organizacji pragnących uzyskać dostęp do niewątpliwej wartości nowej generacji LLM, zarządzając jednocześnie ryzykiem wynikającym ze zidentyfikowanych słabości. Ta droga do sukcesu leży pomiędzy ograniczeniem wykorzystania LLM do komponentów zapewniających dobrze określoną i kontrolowaną funkcjonalność, a osadzeniem ich w odpowiedniej infrastrukturze kontroli i odpowiedzialności. 

Możliwe, że przyszłe LLM rozwiążą problemy, które obecnie uniemożliwiają nieograniczone wykorzystanie tej nowej generacji modeli. Na przykład LLM można z powodzeniem przeprojektować (wykraczając poza przekładniki prądowe), aby skutecznie planować w stosunkowo niedalekiej przyszłości. Technicznie rzecz biorąc, nie wydaje się, aby istniał zasadniczy powód, dla którego nie można tego zrobić, chociaż z pewnością będzie to wymagało kolejnej zdumiewającej inwestycji w moc obliczeniową.  

Inne ograniczenia, takie jak radzenie sobie z rozumowaniem kompozycyjnym, papugowaniem i bezpieczeństwem, wydają się trudniejsze do pokonania. Niezależnie od ciągłego postępu warto wziąć pod uwagę, że znacznie prostsze, dojrzałe i przewidywalne technologie, takie jak poczta elektroniczna, bazy danych i przeglądarki internetowe, nadal wymagają wyrafinowanych wzorców aplikacji i kontroli zarządzania. Wydaje się mało prawdopodobne, aby w przypadku LLM było inaczej. 

Interfejs języka naturalnego prezentowany w wielu programach LLM najnowszej generacji obudził znacznie szerszą populację w szczególności w zakresie możliwości LLM i, bardziej ogólnie, sztucznej inteligencji. W związku z tym zidentyfikowaliśmy niektóre z głównych ograniczeń takich podejść, a jednocześnie przedstawiliśmy zalecenia dotyczące wdrożeń, które mogą złagodzić niektóre z tych problemów, ostatecznie umożliwiając pomyślne przyjęcie LLM. Należy jednak zaznaczyć, że nic to nie eliminuje potrzeby wizji, inwestycji i wykwalifikowanego zespołu do wdrożenia takich rozwiązań. 

Znak czasu:

Więcej z Fintextra