OpenAI propose un détecteur d'IA sujet aux erreurs au milieu des craintes d'un avenir bourré de machines

Republié par Platon

Suiveurs: 0

OpenAI a publié un outil en ligne gratuit conçu pour prédire si un passage de texte a été généré par l'IA ou écrit par un humain.

Surnommé "AI Text Classifier", le logiciel est alimenté par un modèle de langage et évalue la probabilité qu'un morceau de texte ait été généré par un modèle d'IA sur une échelle de cinq points allant de "très improbable" à "peu clair" à "probable". .” Nous l'avons essayé sur certains de nos articles d'il y a une dizaine d'années, et plusieurs vautours peuvent être irrités d'apprendre que leur copie a été classée "incertaine si elle est générée par l'IA".

L'outil, dévoilé mardi, a fait ses débuts des mois après le démarrage lancé ChatGPT, un chatbot qui génère automatiquement du texte lorsque vous y êtes invité, comme répondre à une question, raconter une blague ou écrire un poème. En effet, OpenAI a contribué à alimenter la montée en puissance des robots de diffusion en continu et propose désormais un outil à moitié fictif pour détecter ce genre de choses.

Les écoles et les universités aux États-Unis, en France et en Inde, au moins, ont depuis interdit les étudiants d'accéder à ChatGPT en utilisant leurs réseaux ou de soumettre des essais générés par le logiciel.

Le classificateur est parfois extrêmement confiant dans une mauvaise prédiction

Les experts craignent également que les modèles de génération de texte ne soient utilisés pour émettre des tonnes de fausses informations, des e-mails de phishing, des tonnes et des tonnes de bêtises pour inonder Internet. Nombreuses organisations et les informaticiens ont donc commencé à travailler sur leurs propres outils de classification pour détecter le contenu généré par l'IA.

Le classificateur de texte AI d'OpenAI n'est pas parfait. "Notre utilisation prévue pour le classificateur de texte AI est de favoriser la conversation sur la distinction entre le contenu écrit par l'homme et généré par l'IA", a déclaré le laboratoire financé par Microsoft. a affirmé Valérie Plante..

"Les résultats peuvent aider, mais ne doivent pas être le seul élément de preuve, pour décider si un document a été généré avec l'IA", a ajouté l'organisation. "Le modèle est formé sur du texte écrit par l'homme à partir de diverses sources, qui peuvent ne pas être représentatifs de tous les types de texte écrit par l'homme."

Le classificateur de texte AI est conçu pour détecter le texte créé par la machine à partir de diverses sources, pas seulement son ChatGPT sur-médiatisé. Il a été formé à la fois sur du texte écrit par l'IA à partir de 34 modèles construits par cinq organisations et sur du texte écrit par l'homme extrait d'Internet et extrait d'un ensemble de données internes à l'entreprise.

L'outil nécessite des échantillons de texte de 1,000 XNUMX caractères et ne fonctionne pas bien pour les langues autres que l'anglais. Jan Leike, responsable de l'alignement chez OpenAI dit Axios ses prédictions peuvent produire des faux positifs ou des faux négatifs.

Le classificateur ne sera même pas très utile pour les enseignants qui cherchent à évaluer si un étudiant a rendu un devoir généré par un logiciel comme ChatGPT. Le classificateur de texte AI n'est pas assez sensible pour dire quelles phrases ou extraits peuvent avoir été l'œuvre de l'IA, de sorte que tout texte produit par un ordinateur et modifié par un humain peut échapper à la détection.

«Nous avertissons que le modèle n'a pas été soigneusement évalué sur bon nombre des principales cibles attendues - y compris les essais d'étudiants, les campagnes de désinformation automatisées ou les transcriptions de chat. En effet, les classificateurs basés sur les réseaux de neurones sont connus pour être mal calibrés en dehors de leurs données d'apprentissage. Pour les entrées qui sont très différentes du texte dans notre ensemble de formation, le classificateur est parfois extrêmement confiant dans une mauvaise prédiction », a averti le laboratoire.

OpenAI c'est aussi apparemment explorer d'autres approches pour détecter le texte généré par l'IA, y compris une technique de filigrane qui pourrait être intégrée à ses futurs produits.

Le registre a demandé à OpenAI des commentaires supplémentaires, de préférence non générés par l'IA. ®

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
La source: https://go.theregister.com/feed/www.theregister.com/2023/01/31/openai_tool_chatgpt_detection/

Horodatage: 31 janvier 2023

Plus de Le registre

Le NIST met en garde contre les allégations de sécurité de « l’huile de serpent » des fabricants d’IA

Cluster source:

Le registre

Nœud source: 3049341

Horodatage: Le 5 janvier 2024

Fatigué : scientifiques des données. Wired : Artistes des données

Le registre

Nœud source: 1743340

Horodatage: Le 7 novembre 2022

OpenAI propose un détecteur d'IA sujet aux erreurs au milieu des craintes d'un avenir bourré de machines

Republié par Platon

Plus de Le registre

Fatigué : scientifiques des données. Wired : Artistes des données

Donnez-nous vos données biométriques pour obtenir votre déjeuner en 5 secondes, disent les écoles britanniques aux enfants

Le gouvernement américain espionne la création d'un chatbot IA, selon un rapport

Les universités ont proposé un logiciel pour détecter les essais écrits par ChatGPT

Une approche sur mesure de GenAI

Nvidia, Adobe, Palantir et bien d’autres promettent de créer une IA en toute sécurité

OpenAI, Microsoft et GitHub frappés d'un procès contre Copilot

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte