Aplicación de la cadena de pensamiento al pensamiento humano mejorado con IA - Ross Dawson

Aplicación de la cadena de pensamiento al pensamiento humano mejorado con IA – Ross Dawson

Nodo de origen: 3070889

Entre las innovaciones recientes más importantes para mejorar el valor y la confiabilidad de los modelos de lenguaje grande se encuentran Cadena de pensamiento y sus derivados incluyendo árbol del pensamiento y Gráfico de pensamiento

Estas estructuras también son extremadamente valiosas para diseñar Flujos de trabajo humanos + IA para pensar mejor.

En este artículo proporcionaré una visión de alto nivel de la cadena de pensamiento y luego analizaré las aplicaciones para Inteligencia humana aumentada por IA.

Cadena de pensamiento

Los modelos de lenguaje grande (LLM) son generalmente excelentes en la generación de texto, pero deficientes en cualquier tarea que implique razonamiento secuencial.

El documento histórico de enero de 2022 Las indicaciones de la cadena de pensamientos provocan el razonamiento en modelos de lenguaje extenso expuso cómo una cadena de pensamiento - "una serie de pasos de razonamiento intermedios" - podría mejorar sustancialmente el rendimiento del LLM en tareas de razonamiento que incluyen matemáticas y acertijos de sentido común.

Probablemente hayas visto esta imagen de el papel haciendo las rondas.

Este concepto se adaptó rápidamente a otras aplicaciones, incluidas razonamiento temporal, modelos de lenguaje visual, recuperación razonamiento aumentadoy muchas otras formas de mejorar el rendimiento de los modelos de IA.

La cadena de pensamiento ha demostrado ser particularmente valiosa en aplicaciones prácticas de resolución de problemas. Los ejemplos obvios incluyen medicina, leyy educación

PaLM y Med-PaLM de Google incorporan estructuras de cadena de pensamiento y es muy probable que el GPT-4 de OpenAI lo haga, lo que significa que cuando se utiliza un LLM estos enfoques ya están integrados. 

Aun así, es famoso el mensaje "Resolvamos esto paso a paso para asegurarnos de que tenemos la respuesta correcta" o variaciones de esto. dar el mejor rendimiento LLM para muchos tipos de tareas. 

Evolución de la cadena de pensamiento

Han surgido una serie de innovaciones basándose en la cadena de pensamiento.

Los procesos de razonamiento efectivos no siguen necesariamente una trayectoria única. Esto lleva a árbol del pensamiento estructuras, descritas en Árbol de pensamientos: resolución deliberada de problemas con modelos de lenguaje grandes.

Como se muestra en este diagrama del artículo, la cadena de pensamiento puede avanzar primero hasta seleccionar la ruta más frecuente entre múltiples resultados y luego seleccionar entre la mejor de varias rutas a través del proceso de pensamiento. 

Los desarrollos más recientes sobre Cadena de Pensamiento incluyen el muy prometedor Gráfico de pensamiento al igual que Hipergrafo del pensamiento

Las nuevas estructuras de "pensamiento" serán fundamentales para el progreso de la IA generativa 

Se crearon técnicas de cadena de pensamiento y relacionadas para abordar las limitaciones de los LLM y mejorar sus capacidades. 

El avance continuo de los modelos de IA generativa dependerá mucho más de este tipo de técnicas de pensamiento estructurado que de la capacidad de cómputo o el tamaño del modelo. Estos enfoques ya han permitido LLM pequeños y eficientes para lograr el rendimiento. que puede acercarse al de los modelos más grandes. 

Los modelos de cadena de pensamiento y similares también conducen directamente a cadenas multiagente, en el que se distribuyen cadenas o redes de pensamiento en múltiples modelos optimizados para tareas para crear razonamientos y resultados muy superiores a los que se pueden lograr con un solo modelo.

La inteligencia aumentada es más importante que la Inteligencia General Artificial

"La tecnología no debería aspirar a reemplazar a los humanos, sino más bien a amplificar las capacidades humanas". —Doug Engelbart

La fuerza impulsora detrás de casi todo el desarrollo de la IA parece ser la creación de máquinas que puedan emular y potencialmente superar la inteligencia y las capacidades humanas.

Se trata de una ambición comprensible.

Pero estoy mucho, mucho más interesado en Cómo la IA puede aumentar la inteligencia humana.

Podemos trabajar en ambos dominios a la vez.

Pero en todos los escenarios posibles para avanzar hacia la Inteligencia Artificial General, estaremos mejor si hemos puesto al menos la misma energía en construir, aprender y aplicar estructuras de pensamiento humano + IA.

Flujos de trabajo de pensamiento humanos + IA 

El concepto de Humanos + IA está en el corazón de mi trabajo.

El siguiente marco que creé hace un año muestra mi encuadre inicial de “Flujos de trabajo humanos + IA“, en el que las personas y la IA abordan secuencialmente las tareas para las que están mejor preparadas.

Si esto está bien diseñado, inevitablemente genera resultados superiores a los que cada uno podría lograr por sí solo. 

Desde entonces, he estado investigando con mucho más detalle cuáles son específicamente las mejores estructuras de pensamiento de Humanos + IA.

Estas serán las bases de la siguiente fase de la inteligencia humana aumentada.

Cadena de pensamiento para el pensamiento humano mejorado por IA

Los conceptos que surgen de la Cadena de pensamiento se desarrollaron para mejorar las capacidades independientes de los LLM.

Sin embargo, también demuestran ser inmensamente valiosos para maximizar el valor de que los humanos y la IA trabajen juntos. 

Hay una gama de Técnicas para aplicar estructuras de cadena de pensamiento a flujos de trabajo de pensamiento de humanos + IA..

Conceptos de IA aplicados a la inteligencia aumentada

Los LLM se pueden utilizar para sugerir cómo se pueden descomponer las tareas en elementos secuenciales (o en red), donde los humanos o la IA identifican dónde las capacidades humanas o de la IA pueden ser más adecuadas.

Un enfoque específico se describe en Humano en el circuito a través de la cadena de pensamiento, en el que "la corrección manual de las sublógicas en los fundamentos puede mejorar el rendimiento del razonamiento de LLM".

“Enmarcar” los objetivos, la tarea y la estructura, como se muestra en el diagrama de flujo de trabajo Humanos + IA, impulsa la calidad de los resultados. Por lo general, esto lo supervisan mejor los humanos, utilizando flujos como la IA que propone o evalúa parámetros.

Estoy incorporando estos y otros enfoques en un conjunto de "Patrones de pensamiento mejorados por IA".

En términos más generales, una amplia variedad de avances de la IA, no sólo la cadena de pensamiento, pueden aplicarse de manera extremadamente útil para aumentar la inteligencia humana.  

Tengo la intención de escribir un artículo similar sobre la aplicación de los conceptos de Redes generativas antagónicas a Inteligencia simbiótica humano-IA

Curso sobre pensamiento y toma de decisiones mejorados por IA

Mi enfoque total en 2024 es cómo la IA puede mejorar a los humanos.

Una de mis actividades centrales es realizar un curso de cohorte regular sobre Maven: Pensamiento y toma de decisiones mejorados por IA. Consulte el enlace para obtener más detalles.

La próxima cohorte comienza el 8 de febrero. Como agradecimiento por leer hasta el final de este artículo, puedes obtener un 30 % de descuento utilizando el cupón: COTARTICLE 🙂.

Sello de tiempo:

Mas de Rossdawson