OpenAI lanceert GPT-4 met betere nauwkeurigheid en beweert dat het 90% van de mensen op de SAT kan verslaan

OpenAI lanceert GPT-4 met betere nauwkeurigheid en beweert dat het 90% van de mensen op de SAT kan verslaan

Bronknooppunt: 2014765

Na een enorm succesvolle lancering van zijn ChatGpT in november, heeft OpenAI vandaag de lancering aangekondigd van de nieuwste versie van zijn primaire grote taalmodel, GPT-4. In tegenstelling tot zijn voorgangers, zei OpenAI dat de nieuwe GPT-4 een groot multimodaal model is dat moeilijke problemen nauwkeuriger kan oplossen, eraan toevoegend dat GPT-4 tot nu toe het meest geavanceerde systeem van het bedrijf is, dat veiligere en nuttiger antwoorden oplevert.

Dankzij zijn bredere algemene kennis en probleemoplossend vermogen, zei de door Microsoft gesteunde AI-startup dat de nieuwe GPT-4 "prestaties op menselijk niveau" vertoont bij veel professionele tests. In één test beweerde OpenAI dat GPT-4 presteerde op het 90e percentiel op een gesimuleerd staafexamen, het 89e percentiel op het SAT Math-examen en het 93e percentiel op een SAT leesexamen.

Het bedrijf ging ook naar sociale media om de nieuwe release aan te kondigen.

ChatGPT-4 is ook “groter” dan eerdere versies. Dit betekent dat het is getraind op grotere datasets en meer gewichten in het modelbestand heeft, wat het ook duurder maakt om te draaien. Microsoft zei dinsdag dat de AI-chatbot van Bing ook GPT-4 gebruikt.

In een blogpost op zijn website deelde OpenAI ook een zij-aan-zij vergelijking van ChatGPT en GPT-4 om te laten zien hoe GPT-4 ChatGPT overtreft in zijn geavanceerde redeneermogelijkheden.

OpenAI legde ook uit dat het Microsoft Azure gebruikte om het model te trainen. Zoals we meerdere keren hebben gemeld, heeft het in Redmond gevestigde Microsoft in 1 $ 2019 miljard verdiend, gevolgd door nog eens $ 10 miljard in ruil voor een belang van 49% in het bedrijf.

In slechts twee maanden na de lancering ging ChatGPT van een obscure AI-tool naar het bereiken van 100 miljoen maandelijkse actieve gebruikers in januari, waarmee het de snelst groeiende consumententoepassing in de geschiedenis werd. Het plotselinge succes van ChatGPT heeft andere technologiebedrijven, waaronder Google, Baidu en Alibaba, meer onder druk gezet om hun eigen ChatGPT-achtige tools te lanceren.

Twee jaar geleden schokte OpenAI de wereld met de lancering van zijn Generative Pre-trained Transformer 3 (in de volksmond bekend als GPT-3), een autoregressief taalvoorspellingsmodel dat deep learning gebruikt om on-demand mensachtige tekst te produceren.

OpenAI eerst beschreven GPT-3 in een gepubliceerd onderzoekspaper gepubliceerd in mei 2020. Met maar liefst 175 miljard trainbare parameters die 800 GB opslagruimte vereisen, wordt GPT-3 het krachtigste taalmodel ooit genoemd. Sindsdien heeft GPT-3 gediend als de onderliggende ruggengraat voor AI-contentplatforms zoals Jasper AI, waarmee makers originele inhoud en afbeeldingen 10 keer sneller kunnen maken dan mensen.

Generative Pre-training Transformer (GPT) is een type taalmodel ontwikkeld door OpenAI. Het is een op een neuraal netwerk gebaseerd model dat is getraind om mensachtige tekst te genereren door het volgende woord in een reeks te voorspellen op basis van de woorden die ervoor staan. ChatGPT en andere generatieve AI-tools gebruiken een LLM-techniek (Large Language Model) om tekst te genereren in een chatachtige of conversatiestijl.

De populariteit van OpenAI ChatGPT heeft nu geleid tot een explosieve acceptatie van generatieve kunstmatige intelligentie (AI) en zowel grote technologiebedrijven als kleine startups zijn in een race om het in hun producten te integreren. Sinds de lancering in november heeft ChatGPT indruk gemaakt op veel experts met zijn schrijfvaardigheid, softwarecodering, vaardigheid in het omgaan met complexe taken en het gebruiksgemak.

OpenAI zegt dat het nieuwe model minder feitelijk onjuiste antwoorden zal produceren en in sommige gevallen zelfs beter zal presteren dan mensen op veel gestandaardiseerde tests. OpenAI waarschuwt echter dat hoewel de nieuwe software veelbelovend is, deze niet foutloos is en in verschillende scenario's tekortschiet in de menselijke capaciteiten.

Een belangrijk probleem met de software is 'hallucinatie', wat verwijst naar de neiging om verzonnen informatie te genereren. Bovendien is de software niet consistent betrouwbaar in termen van feitelijke nauwkeurigheid en kan het zijn juistheid blijven beweren, zelfs als het tegendeel bewezen is.

"GPT-4 heeft nog steeds veel bekende beperkingen die we proberen aan te pakken, zoals sociale vooroordelen, hallucinaties en vijandige aanwijzingen", zei het bedrijf in een blogpost.

“In een informeel gesprek kan het onderscheid tussen GPT-3.5 en GPT-4 subtiel zijn. Het verschil komt naar voren wanneer de complexiteit van de taak een voldoende drempel bereikt: GPT-4 is betrouwbaarder, creatiever en kan veel genuanceerdere instructies verwerken dan GPT-3.5”, voegde OpenAI eraan toe.


Tijdstempel:

Meer van TechStartups