OpenAI lancerer GPT-4 med bedre nøjagtighed, hævder, at det kan slå 90% af mennesker på SAT

OpenAI lancerer GPT-4 med bedre nøjagtighed, hævder, at det kan slå 90% af mennesker på SAT

Kildeknude: 2014765

Efter en meget vellykket lancering af sin ChatGpT i november annoncerede OpenAI i dag lanceringen af ​​den seneste version af sin primære store sprogmodel, GPT-4. I modsætning til sine forgængere sagde OpenAI, at den nye GPT-4 er en stor multimodal model, der kan løse vanskelige problemer med større nøjagtighed, og tilføjede, at GPT-4 er virksomhedens mest avancerede system til dato, der producerer sikrere og mere nyttige svar.

Takket være sin bredere generelle viden og problemløsningsevner sagde den Microsoft-støttede AI-startup, at den nye GPT-4 udviser "performance på menneskelig niveau" på mange professionelle tests. I en test hævdede OpenAI, at GPT-4 præsterede på 90. percentilen på en simuleret bar-eksamen, den 89. percentil på SAT Math-eksamenen og den 93. percentil på en SAT-læsningseksamen.

Virksomheden tog også til sociale medier for at annoncere den nye udgivelse.

ChatGPT-4 er også "større" end tidligere versioner. Det betyder, at den er blevet trænet i større datasæt og har flere vægte i sin modelfil, hvilket også gør den dyrere at køre. Microsoft sagde tirsdag, at Bings AI-chatbot også bruger GPT-4.

I en blogindlæg På sin hjemmeside delte OpenAI også en side-by-side sammenligning af ChatGPT og GPT-4 for at vise, hvordan GPT-4 overgår ChatGPT i sine avancerede ræsonnementer.

OpenAI forklarede også, at den brugte Microsoft Azure til at træne modellen. Som vi rapporterede ved flere lejligheder, Redmond-baserede Microsoft en $1 milliard i 2019 efterfulgt af yderligere $10 milliarder i bytte for en 49% aktiepost i virksomheden.

På kun to måneder efter lanceringen gik ChatGPT fra et obskurt AI-værktøj til at nå 100 millioner månedlige aktive brugere i januar, hvilket gør det til den hurtigst voksende forbrugerapplikation i historien. Den pludselige succes med ChatGPT har lagt mere pres på andre teknologivirksomheder, herunder Google, Baidu og Alibaba, for at lancere deres egne ChatGPT-lignende værktøjer.

For to år siden chokerede OpenAI verden med lanceringen af ​​sin Generative Pre-trained Transformer 3 (populært kendt som GPT-3), en autoregressiv sprogforudsigelsesmodel, der bruger dyb læring til at producere menneskelignende tekst efter behov.

OpenAI først beskrev GPT-3 i en publiceret en forskningsartikel offentliggjort i maj 2020. Med hele 175 milliarder parametre, der kan trænes, der kræver 800 GB lagerplads, er GPT-3 blevet kaldt den mest kraftfulde sprogmodel nogensinde. Siden da har GPT-3 fungeret som den underliggende rygrad for AI-indholdsplatforme som Jasper.AI, som gør det muligt for skabere at skabe originalt indhold og billeder 10 gange hurtigere end mennesker.

Generative Pre-training Transformer (GPT) er en type sprogmodel udviklet af OpenAI. Det er en neural netværksbaseret model, der er trænet til at generere menneskelignende tekst ved at forudsige det næste ord i en sekvens baseret på de ord, der kommer før det. ChatGPT og andre generative AI-værktøjer bruger en stor sprogmodel (LLM)-teknik til at generere tekst i en chat-lignende eller samtalestil.

Populariteten af ​​OpenAI ChatGPT har nu ført til et boom i indførelsen af ​​generativ kunstig intelligens (AI), og både store teknologivirksomheder og små startups er i et kapløb om at integrere det i deres produkter. Siden lanceringen i november har ChatGPT imponeret mange eksperter med sin skriveevne, softwarekodning, færdigheder i at håndtere komplekse opgaver og dens brugervenlighed.

OpenAI siger, at den nye model vil producere færre faktuelt forkerte svar og i nogle tilfælde endda yde bedre end mennesker på mange standardiserede tests. OpenAI advarer dog om, at selvom den nye software lover, er den ikke fejlfri og mangler menneskelige evner i flere scenarier.

Et væsentligt problem med softwaren er "hallucination", som refererer til dens tendens til at generere fabrikeret information. Desuden er softwaren ikke konsekvent pålidelig med hensyn til faktuel nøjagtighed og kan fortsætte med at hævde dens rigtighed, selv når det bevises forkert.

"GPT-4 har stadig mange kendte begrænsninger, som vi arbejder på at løse, såsom sociale skævheder, hallucinationer og modstridende opfordringer," sagde virksomheden i et blogindlæg.

"I en afslappet samtale kan skelnen mellem GPT-3.5 og GPT-4 være subtil. Forskellen kommer frem, når kompleksiteten af ​​opgaven når en tilstrækkelig tærskel – GPT-4 er mere pålidelig, kreativ og i stand til at håndtere meget mere nuancerede instruktioner end GPT-3.5,” tilføjede OpenAI.


Tidsstempel:

Mere fra TechStartups