A Meta elindítja a LLaMA mesterséges intelligencia nyelvi modelljét, hogy segítse a kutatókat és felvegye a harcot a ChatGPT-vel

A Meta elindítja a LLaMA mesterséges intelligencia nyelvi modelljét, hogy segítse a kutatókat és felvegye a harcot a ChatGPT-vel

Forrás csomópont: 1976707

A Meta pénteken bejelentette, hogy új, mesterséges intelligencián alapuló nyelvi modellt ad ki a generatív mesterségesintelligencia-verseny felmelegedésével – mondta Mark Zuckerberg vezérigazgató pénteken. Az új nyelvi modellt kutatási célokra szánják, és elérhető lesz az akadémiai kutatók, a kormányzat, a civil társadalom és a tudományos szervezetek, valamint az ipari kutatások számára.

A LLaMA-nak nevezett nyelvi modellt szövegek és beszélgetések generálására, írott anyagok összefoglalására és bonyolult feladatok elvégzésére tervezték, mint például matematikai tételek megoldása vagy fehérjeszerkezetek előrejelzése. Az a Facebook-bejegyzés, Meta mondta:

„Bemutatjuk a LLaMA-t, amely alapnyelvi modellek gyűjteménye 7B-től 65B-ig terjedő paraméterekkel. Modelleinket több billió tokenre oktatjuk, és megmutatjuk, hogy lehetséges a legmodernebb modellek betanítása kizárólag nyilvánosan elérhető adatkészletek felhasználásával, anélkül, hogy szabadalmaztatott és hozzáférhetetlen adatkészleteket kellene igénybe venni. A LLaMA-13B a ​​legtöbb benchmarkon felülmúlja a GPT-3-at (175B), a LLaMA-65B pedig versenyképes a legjobb modellekkel, a Chinchilla70B-vel és a PaLM-540B-vel. Minden modellünket kiadjuk a kutatói közösségnek.”

Guillaume Lample, a Facebook AI-kutatás kutatója szintén Twitter-bejegyzésben mondta:

„Ma kiadjuk a LLaMA-t, 4 alapozómodellt, 7B-től 65B-ig terjedő paraméterekkel. A LLaMA-13B a ​​legtöbb benchmarkon felülmúlja az OPT-t és a GPT-3 175B-t. A LLaMA-65B versenyképes a Chinchilla 70B-vel és a PaLM 540B-vel.”

A ChatGPT 30. november 2022-i megjelenése után megugrott a népszerűségben. Az OpenAI mesterséges intelligenciával működő chatbotja gyakorlatilag bármire képes volt a versírástól és a kódolási hibák részletes példákkal történő kijavításán át a mesterséges intelligencia művészeti utasítások generálásáig. Még a buborékrendezési algoritmus legrosszabb időbeli összetettségét is megmagyarázhatja.

A ChatGPT mindössze két hónap alatt elérte a 100 millió havi aktív felhasználót januárban, így a történelem leggyorsabban növekvő fogyasztói alkalmazásává vált. A múlt héten a cég bejelentette, hogy elindítja a ChatGPT Plus-t, amely egy havi 20 dolláros kísérleti előfizetési terv a népszerű mesterségesintelligencia-alapú chatbotjához. A ChatGPT hirtelen sikere nagyobb nyomást gyakorolt ​​más technológiai cégekre, köztük a Google-ra, a Baidura és az Alibabára.

A ChatGPT egy párbeszéd alapú mesterséges intelligencia csevegési felület a nagy nyelvi modellek GPT-3 családjához. Az észbontó ChatGPT a Generative Pre-trained Transformer 3 (GPT-3) utódja, amely egy autoregresszív nyelvi modell, amely mély tanulást használ az emberszerű szöveg előállításához.

A ChatGPT-t a GPT-3.5 modellből adaptálták, de arra képezték ki, hogy több társalgási választ adjon. A GPT-3-mal ellentétben azonban az új ChatGPT egy sor új képességet mutat be, beleértve a lehetőséget a felhasználókkal folytatott beszélgetésekre, szoftverkódok írására, történetek elmesélésére és összetett matematikai egyenletek megoldására. Az egészben az a szépség, hogy itt tesztelheti saját maga az új chatbotot.

Az alábbiakban letöltheti a LLaMA Whitepaper PDF-másolatát.

333078981_693988129081760_4712707815225756708_n

Időbélyeg:

Még több TechStartups