Tworzenie prawdziwej wartości dzięki LLM

Opublikowane ponownie przez Plato

Obserwuje: 0

W połowie 2023 r. w świecie informatyki panuje ekscytacja w związku z pojawieniem się dużych modeli językowych (LLM), takich jak GPT4/ChatGPT premium i StarChat. Zrozumienie, co te modele mogą, a czego nie mogą zrobić i jak skutecznie zastosować je w celu uzyskania korzyści biznesowych, nie jest proste. Ważne jest, aby przeanalizować pojawiające się badania nad właściwościami LLM obecnej generacji i nakreślić strategie, które należy przyjąć, aby można je było skutecznie zastosować.

LLM są wyjątkowe, ponieważ emitują język w odpowiedzi na język; jeśli model jest stymulowany jakimś tekstem, w odpowiedzi generuje odpowiedni tekst. Oznacza to, że każdy może łatwo wchodzić w interakcję z dowolnym LLM, do którego ma interfejs, a wiele LLM zostało udostępnionych publicznie za pośrednictwem interfejsów czatu. Z tego powodu rozwój LLM jako technologii sztucznej inteligencji miał nagły i znaczący wpływ na społeczne postrzeganie możliwości sztucznej inteligencji.

Zrozumienie LLM

Jedyną rzeczą, którą robią LLM, jest konsumowanie tekstu i tworzenie tekstu, ale ponieważ generowanie tekstu jest tak dobre, wydaje się, że modele rozumują i rozumieją tekst, którym manipulują. Wiele osób zajmujących się językiem naturalnym i badaniami nad sztuczną inteligencją ciężko pracowało, aby zrozumieć i zbadać możliwości LLM. Coraz liczniejsza literatura wskazuje na ograniczenia obecnej generacji modeli i pokazuje, że być może należy złagodzić początkowe podekscytowanie, jakie je wywołało. Ważne jest, aby podsumować obecną listę ograniczeń najnowocześniejszych LLM i ocenić zarówno ich znaczenie, jak i prawdopodobieństwo, że okażą się one fundamentalnymi wadami LLM jako podejścia do sztucznej inteligencji. W innej pracy zbadano niektóre ograniczenia techniczne LLM.

Jednakże przyjrzałem się potwierdzonym ograniczeniom na podstawie kilku prostych przykładów bieżącego zachowania LLM i przeanalizowałem ograniczenia nietechniczne, takie jak kwestie bezpieczeństwa i własności intelektualnej. Po zapoznaniu się z ograniczeniami technologii można następnie sprawdzić, w jaki sposób można ją skutecznie zastosować i na czym przedsiębiorstwa powinny się skupić, aby wygenerować maksymalną wartość z możliwości, jakie stwarza rewolucja LLM.

Droga do sukcesu

Można zdefiniować ścieżkę do sukcesu dla organizacji pragnących uzyskać dostęp do niewątpliwej wartości nowej generacji LLM, zarządzając jednocześnie ryzykiem wynikającym ze zidentyfikowanych słabości. Ta droga do sukcesu leży pomiędzy ograniczeniem wykorzystania LLM do komponentów zapewniających dobrze określoną i kontrolowaną funkcjonalność, a osadzeniem ich w odpowiedniej infrastrukturze kontroli i odpowiedzialności.

Możliwe, że przyszłe LLM rozwiążą problemy, które obecnie uniemożliwiają nieograniczone wykorzystanie tej nowej generacji modeli. Na przykład LLM można z powodzeniem przeprojektować (wykraczając poza przekładniki prądowe), aby skutecznie planować w stosunkowo niedalekiej przyszłości. Technicznie rzecz biorąc, nie wydaje się, aby istniał zasadniczy powód, dla którego nie można tego zrobić, chociaż z pewnością będzie to wymagało kolejnej zdumiewającej inwestycji w moc obliczeniową.

Inne ograniczenia, takie jak radzenie sobie z rozumowaniem kompozycyjnym, papugowaniem i bezpieczeństwem, wydają się trudniejsze do pokonania. Niezależnie od ciągłego postępu warto wziąć pod uwagę, że znacznie prostsze, dojrzałe i przewidywalne technologie, takie jak poczta elektroniczna, bazy danych i przeglądarki internetowe, nadal wymagają wyrafinowanych wzorców aplikacji i kontroli zarządzania. Wydaje się mało prawdopodobne, aby w przypadku LLM było inaczej.

Interfejs języka naturalnego prezentowany w wielu programach LLM najnowszej generacji obudził znacznie szerszą populację w szczególności w zakresie możliwości LLM i, bardziej ogólnie, sztucznej inteligencji. W związku z tym zidentyfikowaliśmy niektóre z głównych ograniczeń takich podejść, a jednocześnie przedstawiliśmy zalecenia dotyczące wdrożeń, które mogą złagodzić niektóre z tych problemów, ostatecznie umożliwiając pomyślne przyjęcie LLM. Należy jednak zaznaczyć, że nic to nie eliminuje potrzeby wizji, inwestycji i wykwalifikowanego zespołu do wdrożenia takich rozwiązań.

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
Źródło: https://www.finextra.com/blogposting/24963/creating-real-value-with-llms?utm_medium=rssfinextra&utm_source=finextrablogs

Znak czasu: 28 września 2023 r.

Znak czasu: Październik 28, 2022

Wprowadzanie życia w centrum danych (Sanjeev Nargotra)

Klaster źródłowy:

Fintextra

Węzeł źródłowy: 1635963

Znak czasu: Sierpnia 23, 2022

Tworzenie prawdziwej wartości dzięki LLM

Opublikowane ponownie przez Plato

Więcej z Fintextra

Banki i firmy kryptograficzne współewoluują. Klienci chcą wygrać. (Arina Dudko)

Chmura to bank (Shirish Netke)

Czy można kontrolować kryptowalutę? (Saied Patel)

Crypto Chronicles: widok konsultanta

Wydaje się, że fintech oferuje bardzo niewiele starszemu konsumentowi, ale w końcu różnica zaczyna się zmniejszać

Wszystko czego potrzebujesz to miłość (Matt Lonsdale)

Projekty SWIFT i CBDC: udane eksperymenty (Carlo RW De Meijer)

L2 i rollupy: jak działają, dlaczego ich potrzebujemy i co dalej (Helen Chmyhankova)

Wprowadzanie życia w centrum danych (Sanjeev Nargotra)

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto