Detección de contenido generado por máquinas: ¿una tarea más fácil para máquinas o humanos?

Reeditado por Platón

seguidores: 0

En el mundo actual estamos rodeados de diversas fuentes de información escrita, información que generalmente asumimos que ha sido escrita por otros humanos. Ya sea en forma de libros, blogs, artículos de noticias, publicaciones en foros, comentarios sobre la página de un producto o discusiones en las redes sociales y en las secciones de comentarios, se supone que el texto que estamos leyendo ha sido escrito por otra persona. Sin embargo, a lo largo de los años, es cada vez más probable que esta suposición sea falsa, más recientemente debido a los grandes modelos de lenguaje (LLM), como GPT-2 y GPT-3, que pueden producir párrafos plausibles sobre casi cualquier tema cuando se solicita.

Esto plantea la cuestión de si estamos a punto de llegar a un punto en el que ya no podamos estar razonablemente seguros de que un comentario en línea, un artículo de noticias o incluso libros y guiones de películas completos no fueron producidos por un algoritmo, o tal vez incluso donde un chat en línea con una nueva pareja candente resulta ser solo tú con una colección de código insensible que fue entrenado y modificado para lograr el máximo compromiso con los clientes. (Nota del editor: no, no vamos a jugar a ese juego aquí).

A medida que el contenido y las interacciones generados por máquinas comienzan a desempeñar un papel cada vez más importante, surge la pregunta de cómo se puede detectar dicho contenido generado y si importa que el contenido haya sido generado por un algoritmo en lugar de por un ser humano. .

Tedio versus malicia

En George Orwell's XNUMX, Winston Smith describe un departamento dentro del Ministerio de la Verdad llamado Departamento de Ficción, donde las máquinas producen constantemente novelas recién generadas basadas en ciertos temas. Mientras tanto, en el Departamento de Música, otro sistema llamado versificador genera nueva música.

Sin embargo, por muy distópico que sea este mundo ficticio, este contenido generado por máquinas es esencialmente inofensivo, como comenta Winston más adelante en el libro, cuando observa a una mujer en el área proletaria de la ciudad cantando la última canción, añadiendo su propia intensidad emocional a una canción. canción de amor escupida por una máquina insensible e irreflexiva. Esto nos lleva al uso más común de contenido generado por máquinas, que muchos dirían que es simplemente una forma de automatización.

El término que lo abarca aquí es 'periodismo automatizado', y tiene estado en uso con medios periodísticos respetados como Reuters, AP y otros desde hace años. Los casos de uso aquí son simples y directos: se trata de sistemas que están configurados para recibir información sobre el desempeño de las acciones, sobre los informes trimestrales de la empresa, sobre los resultados de partidos deportivos o de elecciones locales y producir un artículo siguiendo un patrón preestablecido. La ventaja obvia es que las salas llenas de periodistas que copian tediosamente puntuaciones y métricas de rendimiento en plantillas de artículos pueden ser reemplazadas por un algoritmo informático.

En estos casos, el trabajo que implica el equivalente periodístico o artístico de voltear hamburguesas en un restaurante de comida rápida es reemplazado por un algoritmo que nunca se aburre ni se distrae, mientras que los humanos pueden realizar un trabajo intelectualmente más desafiante. Pocos dirían que existe un problema con este tipo de automatización, ya que básicamente hace exactamente lo que nos prometieron que haría.

Donde las cosas se ponen turbias es cuando se utiliza con fines nefastos, como atraer tráfico de búsqueda con artículos generados por máquinas que intentan venderle algo al lector. Aunque esto ha llevado recientemente a considerable indignación En el caso de CNET, el quid de la cuestión es que se trata de un enfoque increíblemente rentable, por lo que es posible que veamos más de esto en el futuro. Después de todo, un modelo de lenguaje grande puede generar una gran cantidad de artículos en el tiempo que le toma a un escritor humano escribir algunos párrafos de texto.

Una zona más gris es la que se refiere a ayudar a un escritor humano, lo que se está convirtiendo en un problema en el mundo de las publicaciones científicas, ya que cubierto recientemente by El guardián, quienes ellos mismos hicieron un pequeño truco en septiembre de 2020 cuando publicó un artículo que había sido generado por el GPT-3 LLM. La advertencia fue que no era el resultado directo del LLM, sino lo que un editor humano había descifrado a partir de múltiples resultados generados por GPT-3. Esto es bastante indicativo de cómo se utilizan generalmente los LLM y sugiere algunas de sus mayores debilidades.

Sin respuestas incorrectas

En esencia, un LLM como GPT-3 es una base de datos de valores fuertemente interconectada que se generó a partir de textos de entrada que forman el conjunto de datos de entrenamiento. En el caso de GPT-3, esto genera una base de datos (modelo) de aproximadamente 800 GB de tamaño. Para realizar búsquedas en esta base de datos, se proporciona una cadena de consulta (generalmente como una pregunta o frase inicial) que, después del procesamiento, constituye la entrada para un algoritmo de ajuste de curvas. Básicamente, esto determina la probabilidad de que la consulta de entrada esté relacionada con una sección del modelo.

Una vez que se ha encontrado una coincidencia probable, se puede generar un resultado basado en cuál es la siguiente conexión más probable dentro de la base de datos del modelo. Esto permite que un LLM encuentre información específica dentro de un gran conjunto de datos y cree textos teóricamente infinitamente largos. Sin embargo, lo que no puede hacer es determinar si la consulta de entrada tiene sentido o si la salida que genera tiene sentido lógico. Todo lo que el algoritmo puede determinar es si sigue el curso más probable, con posiblemente alguna variación inducida para mezclar la salida.

Algo que todavía se considera un problema con los textos generados por LLM es la repetición, aunque esto se puede resolver con algunos ajustes que le dan al resultado una "memoria" para reducir la cantidad de veces que se usa una palabra específica. Lo que es más difícil de resolver es la confianza absoluta en la producción del LLM, ya que no tiene forma de determinar si simplemente está produciendo tonterías y seguirá balbuceando felizmente.

Sin embargo, a pesar de esto, cuando los sujetos humanos son sometidos a textos generados por GPT-3 y GPT-2 como en un estudio del 2021 Según Elizabeth Clark et al., la probabilidad de que reconozcan textos generados por estos LLM, incluso después de algo de formación, no supera el 55%, lo que lo hace más o menos parecido al puro azar. ¿Por qué los humanos son tan terribles a la hora de reconocer estos textos generados por LLM? ¿Quizás las computadoras puedan ayudarnos en esto?

Estadísticas versus intuición

<img data-attachment-id="573573" data-permalink="https://hackaday.com/2023/02/01/detecting-machine-generated-content-an-easier-task-for-machine-or-human/gehrmann_et_al_2019_figure_1_top_k_overlay_gltr/" data-orig-file="https://platoaistream.com/wp-content/uploads/2023/02/detecting-machine-generated-content-an-easier-task-for-machine-or-human-1.jpg" data-orig-size="381,318" data-comments-opened="1" data-image-meta="{"aperture":"0","credit":"","camera":"","caption":"","created_timestamp":"0","copyright":"","focal_length":"0","iso":"0","shutter_speed":"0","title":"","orientation":"0"}" data-image-title="gehrmann_et_al_2019_figure_1_top_k_overlay_GLTR" data-image-description data-image-caption="

(Crédito: Gehrmann et al., 2019)

” data-medium-file=”https://platoaistream.com/wp-content/uploads/2023/02/detecting-machine-generated-content-an-easier-task-for-machine-or-human.jpg” data-large-file=”https://platoaistream.com/wp-content/uploads/2023/02/detecting-machine-generated-content-an-easier-task-for-machine-or-human.jpg” decoding=”async” loading=”lazy” class=”size-medium wp-image-573573″ src=”https://platoaistream.com/wp-content/uploads/2023/02/detecting-machine-generated-content-an-easier-task-for-machine-or-human.jpg” alt width=”381″ height=”318″ srcset=”https://platoaistream.com/wp-content/uploads/2023/02/detecting-machine-generated-content-an-easier-task-for-machine-or-human-1.jpg 381w, https://platoaistream.com/wp-content/uploads/2023/02/detecting-machine-generated-content-an-easier-task-for-machine-or-human-1.jpg?resize=250,209 250w” sizes=”(max-width: 381px) 100vw, 381px”>

(Crédito: Gehrmann et al., 2019)

Cuando se le pregunta a un ser humano si un texto determinado fue creado por un humano o generado por una máquina, es probable que esencialmente adivine basándose en sus propias experiencias, un "instinto" y posiblemente una variedad de pistas. en un papel 2019 Por Sebastian Gehrmann et al., se propone un enfoque estadístico para detectar texto generado automáticamente, además de identificar una variedad de casos nefastos de texto generado automáticamente. Estos incluyen comentarios falsos contra la neutralidad de la red estadounidense y reseñas engañosas.

El enfoque estadístico detallado por Gehrmann et al. se llama Sala de pruebas modelo de lenguaje gigante (GLTR, fuente de GitHub) implica analizar un texto determinado para determinar su previsibilidad. Esta es una característica que los lectores suelen describir como "superficialidad" de un texto generado por máquina, en el sentido de que sigue parloteando párrafos sin decir mucho. Con una herramienta como GLTR, dicho texto se iluminaría principalmente en verde en la representación visual, ya que utiliza un vocabulario limitado y predecible.

In un artículo presentado por Daphne Ippolito et al. (PDF) en la reunión de 2020 de la Asociación de Lingüística Computacional, se tratan los diversos enfoques para detectar texto generado por máquina, junto con la efectividad de estos métodos utilizados de forma aislada versus combinados. El enfoque de análisis top-k utilizado por GLTR se incluye en estos métodos, y también se abordan los enfoques alternativos de muestreo de núcleos (top-p) y otros.

En última instancia, en este estudio los sujetos humanos obtuvieron una mediana del 74% al clasificar textos GPT-2, y el sistema discriminador automatizado generalmente obtuvo una mejor puntuación. Destaca el estudio de Ari Holtzman et al. a eso se hace referencia en la conclusión, en la que se señala que el texto escrito por humanos generalmente tiene una cadencia que entra y sale de una zona de baja probabilidad. Esto no sólo hace que un texto sea interesante de leer, sino que también proporciona una pista de lo que hace que el texto parezca natural para un lector humano.

Con LLM modernos como GPT-3, un enfoque como el muestreo de núcleos propuesto por Holtzman et al. es lo que proporciona la cadencia más natural que se esperaría de un texto escrito por un humano. En lugar de elegir de una lista de k opciones principales, se selecciona de un grupo de candidatos cuyo tamaño cambia dinámicamente: la masa de probabilidad. La lista de opciones resultante, top-p, proporciona un resultado mucho más rico que con el enfoque top-k que se usó con GPT-2 y parientes.

Lo que esto también significa es que en el análisis automático de un texto se deben considerar múltiples enfoques. Para el análisis realizado por un lector humano, la distinción entre un texto top-k (GPT-2) y top-p (GPT-3) sería marcada, y es probable que el último tipo se identifique como escrito por un humano.

Tiempos inciertos

Por lo tanto, parecería que la respuesta a la pregunta de si un texto determinado fue generado por un humano o no es un "tal vez" definitivo. Aunque el análisis estadístico puede proporcionar algunas pistas sobre la probabilidad de que un texto haya sido generado por un LLM, en última instancia, el juicio final tendría que recaer en un ser humano, quien no sólo puede determinar si el texto es semántica y contextualmente correcto, sino también verificarlo. la presunta fuente de un texto por ser genuina.

Naturalmente, hay muchas situaciones en las que puede no importar quién escribió un texto, siempre que la información que contiene sea correcta. Sin embargo, cuando existe una posible intención nefasta o la intención de engañar, conviene practicar la debida diligencia. Incluso con algoritmos de detección automática implementados y con un usuario capacitado y cauteloso, sigue siendo responsabilidad del lector cruzar la información y determinar si una declaración hecha por una cuenta aleatoria en las redes sociales podría ser genuina.

(Nota del editor: Esta publicación sobre el intento de OpenAI de detectar su propia prosa surgió entre la redacción y publicación de este artículo. Sus resultados no son tan buenos y, como ocurre con todo lo relacionado con la IA "abierta", sus métodos no se divulgan públicamente. Sin embargo, puedes probar el clasificador).

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
Platoblockchain. Inteligencia del Metaverso Web3. Conocimiento amplificado. Accede Aquí.
Fuente: https://hackaday.com/2023/02/01/detecting-machine-generated-content-an-easier-task-for-machine-or-human/

Sello de tiempo: Febrero 1, 2023

Sello de tiempo: 12 de octubre de 2023

Reeditado por Platón

Cosechando energía mecánica de la lluvia que cae

Walkie-Talkie de bricolaje con ESP32 y ESP-NOW

Son las cosas simples

La actualización pone muchos ceros en el contador de frecuencia integrado en el kit

Colocador automático de componentes controlados por física

Diseño para personas

Recordando a Niklaus Wirth: padre de Pascal e inspiración para muchos

Los nanobots se autorreplican

Gadgets retro: el osciloscopio de bolsillo de 1983

Tienes correo: todo depende del código postal

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta