OpenAI har gitt ut et gratis nettbasert verktøy designet for å forutsi om en tekstpassasje ble generert av AI eller skrevet av et menneske.
Programvaren, kalt "AI Text Classifier", er drevet av en språkmodell og vurderer sannsynligheten for at en tekstbit ble generert av en AI-modell på en fempunkts skala som går fra "veldig usannsynlig" til "uklar" til "sannsynlig" ." Vi prøvde det på noen av artiklene våre for et tiår eller så siden, og flere gribber kan bli fortvilet over å høre at kopien deres ble vurdert som "uklart om den er AI-generert."
Verktøyet, som ble avduket tirsdag, debuterte måneder etter oppstarten lansert ChatGPT, en chatbot som automatisk genererer tekst når du blir bedt om det, for eksempel å svare på et spørsmål, fortelle en vits eller skrive et dikt. Faktisk bidro OpenAI til å øke økningen i roboter for prattle-streaming, og tilbyr nå et halvverdig verktøy for å oppdage denne typen ting.
Skoler og universiteter i USA, Frankrike og India har i det minste gjort det siden utestengt studenter fra å få tilgang til ChatGPT ved å bruke nettverkene deres eller fra å sende inn essays generert av programvaren.
Klassifisereren er noen ganger ekstremt sikker på en feil prediksjon
Eksperter frykter også at tekstgenerasjonsmodeller kan brukes til å sende ut tonnevis av feilinformasjon, phishing-e-poster, mengder med tull og tull for å oversvømme internett. Flere organisasjoner og informatikere har derfor startet arbeidet med sine egne klassifiseringsverktøy for å oppdage AI-generert innhold.
OpenAIs AI Text Classifier er ikke perfekt. "Vår tiltenkte bruk for AI Text Classifier er å fremme samtale om skillet mellom menneskelig skrevet og AI-generert innhold," det Microsoft-bankrolled laboratoriet sa.
"Resultatene kan hjelpe, men bør ikke være det eneste beviset, når man skal avgjøre om et dokument ble generert med AI," la organisasjonen til. "Modellen er trent på menneskeskreven tekst fra en rekke kilder, som kanskje ikke er representativ for alle typer menneskeskreven tekst."
AI Text Classifier er designet for å oppdage maskinlaget tekst fra forskjellige kilder, ikke bare den overhypede ChatGPT. Den ble trent på både AI-skrevet tekst fra 34 modeller bygget av fem organisasjoner, og menneskeskreven tekst skrapet fra internett og hentet fra et internt firmadatasett.
Verktøyet krever teksteksempler på 1,000 tegn, og fungerer ikke bra for andre språk enn engelsk. OpenAIs linjesjef Jan Leike fortalte Axios dens spådommer kan produsere falske positive eller falske negative.
Klassifiseringen vil ikke engang være så nyttig for lærere som ønsker å vurdere om en student har levert en oppgave generert av programvare som ChatGPT. AI-tekstklassifikatoren er ikke sensitiv nok til å fortelle hvilke setninger eller utdrag som kan ha vært AIs arbeid, så all tekst produsert av en datamaskin og tilpasset av et menneske kan unngå gjenkjenning.
"Vi advarer om at modellen ikke har blitt nøye evaluert på mange av de forventede hovedmålene - inkludert studentoppgaver, automatiserte desinformasjonskampanjer eller chat-utskrifter. Faktisk er klassifikatoren basert på nevrale nettverk kjent for å være dårlig kalibrert utenfor treningsdataene deres. For inndata som er svært forskjellig fra tekst i treningssettet vårt, er klassifisereren noen ganger ekstremt sikker på en feil prediksjon,» advarte laboratoriet.
OpenAI er også velig utforske andre tilnærminger for å oppdage AI-generert tekst, inkludert en vannmerketeknikk som kan bygges inn i fremtidige produkter.
Registeret har bedt OpenAI om ytterligere, fortrinnsvis ikke-AI-generert, kommentar. ®
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- kilde: https://go.theregister.com/feed/www.theregister.com/2023/01/31/openai_tool_chatgpt_detection/
- 000
- 1
- a
- Om oss
- Tilgang
- la til
- Etter
- AI
- Alle
- Amid
- og
- tilnærminger
- artikler
- Automatisert
- automatisk
- Axios
- basert
- mellom
- roboter
- bygget
- Kampanjer
- nøye
- tegn
- chatbot
- ChatGPT
- kommentere
- Selskapet
- datamaskin
- trygg
- innhold
- Samtale
- kunne
- dato
- debuterte
- tiår
- Avgjør
- designet
- Gjenkjenning
- forskjellig
- desinformasjon
- dokument
- effekt
- e-post
- Engelsk
- nok
- Eter (ETH)
- evaluert
- Selv
- bevis
- forventet
- Utforske
- ekstremt
- frykt
- frykt
- Foster
- Frankrike
- Gratis
- fra
- Brensel
- videre
- framtid
- generert
- genererer
- Går
- hode
- hjelpe
- hjulpet
- HTTPS
- menneskelig
- in
- Inkludert
- india
- intern
- Internet
- IT
- jan
- Type
- kjent
- lab
- Språk
- språk
- LÆRE
- Sannsynlig
- ser
- mange
- feil~~POS=TRUNC
- modell
- modeller
- måneder
- nettverk
- neural
- nevrale nettverk
- Tilbud
- på nett
- OpenAI
- organisasjon
- organisasjoner
- Annen
- utenfor
- egen
- perfekt
- phishing
- brikke
- plato
- Platon Data Intelligence
- PlatonData
- powered
- forutsi
- prediksjon
- Spådommer
- prinsipp
- produsere
- produsert
- Produkter
- spørsmål
- priser
- utgitt
- representant
- Krever
- Resultater
- Rise
- Skala
- forskere
- sensitive
- sett
- flere
- bør
- siden
- So
- Software
- noen
- Kilder
- startet
- oppstart
- Student
- Studenter
- innsendt
- slik
- mål
- lærere
- De
- deres
- derfor
- til
- Tone
- verktøy
- verktøy
- trent
- Kurs
- tirsdag
- universiteter
- avduket
- us
- bruke
- variasjon
- ulike
- om
- hvilken
- HVEM
- vil
- Arbeid
- skrevet
- Feil
- zephyrnet