OpenAI a publié un outil en ligne gratuit conçu pour prédire si un passage de texte a été généré par l'IA ou écrit par un humain.
Surnommé "AI Text Classifier", le logiciel est alimenté par un modèle de langage et évalue la probabilité qu'un morceau de texte ait été généré par un modèle d'IA sur une échelle de cinq points allant de "très improbable" à "peu clair" à "probable". .” Nous l'avons essayé sur certains de nos articles d'il y a une dizaine d'années, et plusieurs vautours peuvent être irrités d'apprendre que leur copie a été classée "incertaine si elle est générée par l'IA".
L'outil, dévoilé mardi, a fait ses débuts des mois après le démarrage lancé ChatGPT, un chatbot qui génère automatiquement du texte lorsque vous y êtes invité, comme répondre à une question, raconter une blague ou écrire un poème. En effet, OpenAI a contribué à alimenter la montée en puissance des robots de diffusion en continu et propose désormais un outil à moitié fictif pour détecter ce genre de choses.
Les écoles et les universités aux États-Unis, en France et en Inde, au moins, ont depuis interdit les étudiants d'accéder à ChatGPT en utilisant leurs réseaux ou de soumettre des essais générés par le logiciel.
Le classificateur est parfois extrêmement confiant dans une mauvaise prédiction
Les experts craignent également que les modèles de génération de texte ne soient utilisés pour émettre des tonnes de fausses informations, des e-mails de phishing, des tonnes et des tonnes de bêtises pour inonder Internet. Nombreuses organisations et les informaticiens ont donc commencé à travailler sur leurs propres outils de classification pour détecter le contenu généré par l'IA.
Le classificateur de texte AI d'OpenAI n'est pas parfait. "Notre utilisation prévue pour le classificateur de texte AI est de favoriser la conversation sur la distinction entre le contenu écrit par l'homme et généré par l'IA", a déclaré le laboratoire financé par Microsoft. a affirmé Valérie Plante..
"Les résultats peuvent aider, mais ne doivent pas être le seul élément de preuve, pour décider si un document a été généré avec l'IA", a ajouté l'organisation. "Le modèle est formé sur du texte écrit par l'homme à partir de diverses sources, qui peuvent ne pas être représentatifs de tous les types de texte écrit par l'homme."
Le classificateur de texte AI est conçu pour détecter le texte créé par la machine à partir de diverses sources, pas seulement son ChatGPT sur-médiatisé. Il a été formé à la fois sur du texte écrit par l'IA à partir de 34 modèles construits par cinq organisations et sur du texte écrit par l'homme extrait d'Internet et extrait d'un ensemble de données internes à l'entreprise.
L'outil nécessite des échantillons de texte de 1,000 XNUMX caractères et ne fonctionne pas bien pour les langues autres que l'anglais. Jan Leike, responsable de l'alignement chez OpenAI dit Axios ses prédictions peuvent produire des faux positifs ou des faux négatifs.
Le classificateur ne sera même pas très utile pour les enseignants qui cherchent à évaluer si un étudiant a rendu un devoir généré par un logiciel comme ChatGPT. Le classificateur de texte AI n'est pas assez sensible pour dire quelles phrases ou extraits peuvent avoir été l'œuvre de l'IA, de sorte que tout texte produit par un ordinateur et modifié par un humain peut échapper à la détection.
«Nous avertissons que le modèle n'a pas été soigneusement évalué sur bon nombre des principales cibles attendues - y compris les essais d'étudiants, les campagnes de désinformation automatisées ou les transcriptions de chat. En effet, les classificateurs basés sur les réseaux de neurones sont connus pour être mal calibrés en dehors de leurs données d'apprentissage. Pour les entrées qui sont très différentes du texte dans notre ensemble de formation, le classificateur est parfois extrêmement confiant dans une mauvaise prédiction », a averti le laboratoire.
OpenAI c'est aussi apparemment explorer d'autres approches pour détecter le texte généré par l'IA, y compris une technique de filigrane qui pourrait être intégrée à ses futurs produits.
Le registre a demandé à OpenAI des commentaires supplémentaires, de préférence non générés par l'IA. ®
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
- La source: https://go.theregister.com/feed/www.theregister.com/2023/01/31/openai_tool_chatgpt_detection/
- 000
- 1
- a
- A Propos
- accès
- ajoutée
- Après
- AI
- Tous
- Au milieu de
- ainsi que
- approches
- sur notre blog
- Automatisation
- automatiquement
- Axios
- basé
- jusqu'à XNUMX fois
- les robots
- construit
- Campagnes
- prudemment
- caractères
- Chatbot
- ChatGPT
- commentaire
- Société
- ordinateur
- confiance
- contenu
- Conversation
- pourriez
- données
- a fait ses débuts
- décennie
- Décider
- un
- Détection
- différent
- désinformation
- document
- effet
- emails
- Anglais
- assez
- Ether (ETH)
- évalué
- Pourtant, la
- preuve
- attendu
- Explorer
- extrêmement
- peur
- craintes
- Accueillir
- France
- Gratuit
- De
- Carburant
- plus
- avenir
- généré
- génère
- Goes
- front
- vous aider
- a aidé
- HTTPS
- humain
- in
- Y compris
- Inde
- interne
- Internet
- IT
- Janvier
- Genre
- connu
- laboratoire
- langue
- Langues
- APPRENTISSAGE
- Probable
- recherchez-
- de nombreuses
- Désinformation
- modèle
- numériques jumeaux (digital twin models)
- mois
- réseaux
- Neural
- les réseaux de neurones
- Offres Speciales
- en ligne
- OpenAI
- organisation
- organisations
- Autre
- au contrôle
- propre
- parfaite
- phishing
- pièce
- Platon
- Intelligence des données Platon
- PlatonDonnées
- alimenté
- prévoir
- prédiction
- Prédictions
- principe
- produire
- Produit
- Produits
- question
- Tarifs
- libéré
- représentant
- a besoin
- Résultats
- Augmenter
- Escaliers intérieurs
- scientifiques
- sensible
- set
- plusieurs
- devrait
- depuis
- So
- Logiciels
- quelques
- Sources
- j'ai commencé
- Commencez
- Étudiant
- Étudiante
- soumis
- tel
- objectifs
- enseignants
- La
- leur
- donc
- à
- tonnes
- outil
- les outils
- qualifié
- Formation
- Mardi
- Universités
- dévoilé
- us
- utilisé
- variété
- divers
- que
- qui
- WHO
- sera
- activités principales
- code écrit
- faux
- zéphyrnet