Meta, aby uruchomić model języka AI LLaMA, aby pomóc naukowcom i zająć się ChatGPT

Meta, aby uruchomić model języka AI LLaMA, aby pomóc naukowcom i zająć się ChatGPT

Węzeł źródłowy: 1976707

Meta ogłosiła w piątek, że wypuszcza nowy model językowy oparty na sztucznej inteligencji, ponieważ wyścig generatywnej sztucznej inteligencji nabiera tempa, powiedział w piątek dyrektor generalny Mark Zuckerberg. Nowy model językowy jest przeznaczony do użytku w badaniach i będzie dostępny dla badaczy akademickich, rządu, społeczeństwa obywatelskiego i organizacji akademickich oraz badań przemysłowych.

Model językowy, nazwany LLaMA, jest przeznaczony do generowania tekstu i konwersacji, podsumowywania materiałów pisanych i wykonywania skomplikowanych zadań, takich jak rozwiązywanie twierdzeń matematycznych lub przewidywanie struktur białek. W Facebook postuMeta powiedział:

„Wprowadzamy LLaMA, zbiór podstawowych modeli językowych o parametrach od 7B do 65B. Szkolimy nasze modele na bilionach tokenów i pokazujemy, że możliwe jest trenowanie najnowocześniejszych modeli wyłącznie przy użyciu publicznie dostępnych zestawów danych, bez uciekania się do zastrzeżonych i niedostępnych zestawów danych. W szczególności LLaMA-13B przewyższa GPT-3 (175B) w większości testów porównawczych, a LLaMA-65B konkuruje z najlepszymi modelami, Chinchilla70B i PaLM-540B. Udostępniamy wszystkie nasze modele społeczności badawczej”.

Również w poście na Twitterze, naukowiec z Facebook AI Research Guillaume Lample powiedział:

„Dzisiaj wypuszczamy LLaMA, 4 modele fundamentów o parametrach od 7B do 65B. LLaMA-13B przewyższa OPT i GPT-3 175B w większości testów porównawczych. LLaMA-65B jest konkurencyjna w stosunku do Chinchilla 70B i PaLM 540B.”

ChatGPT zyskał na popularności po wydaniu 30 listopada 2022 r. Oparty na sztucznej inteligencji chatbot OpenAI mógł robić praktycznie wszystko, od pisania poezji i poprawiania błędów w kodowaniu za pomocą szczegółowych przykładów, po generowanie monitów graficznych AI. Może nawet wyjaśnić złożoność czasową algorytmu sortowania bąbelkowego w najgorszym przypadku.

W ciągu zaledwie dwóch miesięcy ChatGPT osiągnął w styczniu 100 milionów aktywnych użytkowników miesięcznie, co czyni go najszybciej rozwijającą się aplikacją konsumencką w historii. W zeszłym tygodniu firma ogłosiła, że ​​uruchamia ChatGPT Plus, pilotażowy plan subskrypcji za 20 USD miesięcznie dla swojego popularnego chatbota opartego na sztucznej inteligencji. Nagły sukces ChatGPT wywarł większą presję na inne firmy technologiczne, w tym Google, Baidu i Alibaba.

ChatGPT to oparty na dialogach interfejs czatu AI dla rodziny dużych modeli językowych GPT-3. Oszałamiający ChatGPT jest następcą Generative Pre-trained Transformer 3 (GPT-3), który jest autoregresyjnym modelem językowym, który wykorzystuje głębokie uczenie się do tworzenia tekstu podobnego do ludzkiego.

ChatGPT został zaadaptowany z modelu GPT-3.5, ale został przeszkolony w zakresie udzielania bardziej konwersacyjnych odpowiedzi. Jednak w przeciwieństwie do GPT-3, nowy ChatGPT demonstruje szereg nowych możliwości, w tym możliwość angażowania się w rozmowy z użytkownikami, pisania kodów oprogramowania, opowiadania historii i dostarczania rozwiązań złożonych równań matematycznych. Piękno tego wszystkiego polega na tym, że możesz sam przetestować nowego chatbota tutaj.

Poniżej możesz pobrać kopię dokumentu PDF LLaMA Whitepaper.

333078981_693988129081760_4712707815225756708_n

Znak czasu:

Więcej z TechStartupy