Una lista completa de recursos para dominar modelos de lenguaje grandes - KDnuggets

Reeditado por Platón

seguidores: 0

Una lista completa de recursos para dominar modelos de lenguaje grandes
Imagen generada con Leonardo.Ai

En este vasto panorama de la IA, surgió una fuerza revolucionaria en forma de modelos de lenguaje grandes (LLMS). No es sólo una palabra de moda sino nuestro futuro. Su capacidad para comprender y generar textos similares a los humanos los puso en el centro de atención y ahora se ha convertido en una de las áreas de investigación más candentes. Imagine un chatbot que pueda responderle como si estuviera hablando con sus amigos o imagine un sistema de generación de contenido que resulte difícil distinguir si está escrito por un humano o una IA. Si cosas como esta te intrigan y quieres profundizar más en el corazón de los LLM, entonces estás en el lugar correcto. He reunido una lista completa de recursos que van desde artículos informativos, cursos y repositorios de GitHub hasta artículos de investigación relevantes que pueden ayudarlo a comprenderlos mejor. Sin más demora, comencemos nuestro increíble viaje en el mundo de los LLM.

Una lista completa de recursos para dominar modelos de lenguaje grandes
Imagen de Polina Tankilevitch en Pexels

1. Especialización en aprendizaje profundo - Coursera

Enlace: Especialización de aprendizaje profundo

Descripción: El aprendizaje profundo constituye la columna vertebral de los LLM. Este curso integral impartido por Andrew Ng cubre los temas esenciales de las redes neuronales, los conceptos básicos de la visión por computadora y el procesamiento del lenguaje natural, y cómo estructurar sus proyectos de aprendizaje automático.

2. Stanford CS224N: PNL con aprendizaje profundo – YouTube

Enlace: Stanford CS224N: PNL con aprendizaje profundo

Descripción: Es una mina de oro de conocimiento y proporciona una introducción exhaustiva a la investigación de vanguardia en aprendizaje profundo para PNL.

3. Curso de transformadores de HuggingFace - HuggingFace

Enlace: Curso de Transformers de HuggingFace

Descripción: Este curso enseña PNL utilizando bibliotecas del ecosistema HuggingFace. Cubre el funcionamiento interno y el uso de las siguientes bibliotecas de HuggingFace:

Transformers
Tokenizadores
Conjuntos de datos
Accelerate

4. Ingeniería de mensajes ChatGPT para desarrolladores – Coursera

Enlace: Curso de ingeniería rápida ChatGPT

Descripción: ChatGPT es un LLM popular y este curso comparte las mejores prácticas y los principios esenciales para redactar indicaciones efectivas para generar una mejor respuesta.

Una lista completa de recursos para dominar modelos de lenguaje grandes
Imagen generada con Leonardo.Ai

1. Universidad LLM - Cohere

Enlace: Universidad LLM

Descripción: Cohere ofrece un curso especializado para dominar los LLM. Su seguimiento secuencial, que cubre en detalle los aspectos teóricos de la PNL, los LLM y su arquitectura, está dirigido a principiantes. Su camino no secuencial es para personas con experiencia interesadas más en las aplicaciones prácticas y los casos de uso de estos poderosos modelos que en su funcionamiento interno.

2. Stanford CS324: Modelos de lenguajes grandes - Sitio de Stanford

Enlace: Stanford CS324: modelos de lenguaje grandes

Descripción: Este curso profundiza en las complejidades de estos modelos. Explorará los fundamentos, la teoría, la ética y los aspectos prácticos de estos modelos y, al mismo tiempo, obtendrá experiencia práctica.

3. Princeton COS597G: Comprensión de los modelos de lenguaje grandes – Sitio de Princeton

Enlace: Comprender los modelos de lenguaje grandes

Descripción: Es un curso de posgrado que ofrece un plan de estudios integral, lo que lo convierte en una excelente opción para un aprendizaje en profundidad. Explorará los fundamentos técnicos, las capacidades y las limitaciones de modelos como BERT, GPT, modelos T5, modelos de combinación de expertos, modelos basados en recuperación, etc.

4. ETH Zurich: Modelos de lenguajes grandes (LLM) - RycoLab

Enlace: ETH Zurich: modelos de lenguaje grandes

Descripción: Este curso recientemente diseñado ofrece una exploración integral de los LLM. Profundice en fundamentos probabilísticos, modelado de redes neuronales, procesos de capacitación, técnicas de escalamiento y debates críticos sobre seguridad y posibles usos indebidos.

5. Bootcamp LLM de pila completa: la pila completa

Enlace: Curso intensivo de LLM de pila completa

Descripción: El campo de entrenamiento Full Stack LLM es un curso relevante para la industria que cubre temas como técnicas de ingeniería rápida, fundamentos de LLM, estrategias de implementación y diseño de interfaz de usuario, lo que garantiza que los participantes estén bien preparados para crear e implementar aplicaciones de LLM.

6. Ajuste fino de modelos de lenguajes grandes – Coursera

Enlace: Ajuste fino de modelos de lenguaje grande

Descripción: Fine Tuning es la técnica que le permite adaptar los LLM a sus necesidades específicas. Al completar este curso, comprenderá cuándo aplicar el ajuste, la preparación de datos para el ajuste y cómo capacitar a su LLM con nuevos datos y evaluar su desempeño.

Una lista completa de recursos para dominar modelos de lenguaje grandes
Imagen generada con Leonardo.Ai

1. ¿Qué hace ChatGPT... y por qué funciona? -Steven Wolfram

Enlace: ¿Qué hace ChatGPT... y por qué funciona?

Descripción: Este breve libro está escrito por Steven Wolfram, un científico de renombre. Analiza los aspectos fundamentales de ChatGPT, sus orígenes en las redes neuronales y sus avances en transformadores, mecanismos de atención y procesamiento del lenguaje natural. Es una lectura excelente para alguien interesado en explorar las capacidades y limitaciones de los LLM.

2. Comprensión de los modelos de lenguaje grandes: una lista de lectura transformadora – Sebastian Raschka

Enlace: Comprensión de modelos de lenguaje grandes: una lista de lectura transformadora

Descripción: Contiene una colección de artículos de investigación importantes y proporciona una lista de lecturas cronológicas, desde los primeros artículos sobre redes neuronales recurrentes (RNN) hasta el influyente modelo BERT y más allá. Es un recurso invaluable para que investigadores y profesionales estudien la evolución de la PNL y los LLM.

3. Serie de artículos: Modelos de lenguajes grandes - Jay Alammar

Enlace: Serie de artículos: Modelos de lenguaje grandes

Descripción: Los blogs de Jay Alammar son un tesoro de conocimientos para cualquiera que estudie modelos de lenguajes grandes (LLM) y transformadores. Sus blogs se destacan por su combinación única de visualizaciones, explicaciones intuitivas y cobertura integral del tema.

4. Creación de aplicaciones LLM para producción: Chip Huyen

Enlace: Creación de aplicaciones LLM para producción

Descripción: En este artículo, se analizan los desafíos de producir LLM. Ofrece información sobre la componibilidad de tareas y muestra casos de uso prometedores. Cualquier persona interesada en LLM prácticos lo encontrará realmente valioso.

Una lista completa de recursos para dominar modelos de lenguaje grandes
Imagen de RealToughCandy.com en Pexels

1. Impresionante-LLM (9k ⭐)

Enlace: Impresionante-LLM

Descripción: Es una colección curada de artículos, marcos, herramientas, cursos, tutoriales y recursos centrados en modelos de lenguajes grandes (LLM), con especial énfasis en ChatGPT.

2. Guía práctica de LLM (6.9k ⭐)

Enlace: Las guías prácticas para modelos de lenguaje grandes

Descripción: Ayuda a los profesionales a navegar por el amplio panorama de los LLM. Se basa en el documento de encuesta titulado: Aprovechar el poder de los LLM en la práctica: una encuesta sobre ChatGPT y más allá y así blog.

3. Encuesta LLM (6.1k ⭐)

Enlace: Encuesta LLM

Descripción: Es una colección de artículos de encuesta y recursos basados en el artículo titulado: Una encuesta de modelos de lenguaje grande. También contiene una ilustración de la evolución técnica de los modelos de la serie GPT, así como un gráfico evolutivo del trabajo de investigación realizado en LLaMA.

4. Awesome Graph-LLM (637 ⭐)

Enlace: Awesome-Graph-LLM

Descripción: Es una fuente valiosa para las personas interesadas en la intersección de técnicas basadas en gráficos con LLM. proporciona una colección de artículos de investigación, conjuntos de datos, puntos de referencia, encuestas y herramientas que profundizan en este campo emergente.

5. Impresionante Langchain (5.4k ⭐)

Enlace: impresionante-langchain

Descripción: LangChain es el marco rápido y eficiente para proyectos LLM y este repositorio es el centro para rastrear iniciativas y proyectos relacionados con el ecosistema de LangChain.

"Una encuesta completa sobre ChatGPT en la era AIGC” – Es un excelente punto de partida para principiantes en LLM. Cubre de manera integral la tecnología, las aplicaciones y los desafíos subyacentes de ChatGPT.
"Una encuesta de modelos de lenguaje grande”- Cubre los avances recientes en los LLM específicamente en los cuatro aspectos principales de capacitación previa, ajuste de adaptación, utilización y evaluación de capacidad.
"Desafíos y aplicaciones de modelos de lenguaje grandes”- Analiza los desafíos de los LLM y las áreas de aplicación exitosas de los LLM.
"La atención es todo lo que necesitas”- Los transformadores sirven como piedra angular para GPT y otros LLM y este documento presenta la arquitectura Transformer.
"El transformador anotado”: un recurso de la Universidad de Harvard que proporciona una explicación detallada y comentada de la arquitectura Transformer, que es fundamental para muchos LLM.
"El transformador ilustrado” – Una guía visual que le ayuda a comprender en profundidad la arquitectura de Transformer, haciendo que los conceptos complejos sean más accesibles.
"BERT: pre-entrenamiento de transformadores bidireccionales profundos para la comprensión del lenguaje” – Este artículo presenta BERT, un LLM muy influyente que establece nuevos puntos de referencia para numerosas tareas de procesamiento del lenguaje natural (NLP).

En este artículo, he seleccionado una lista extensa de recursos esenciales para dominar los modelos de lenguajes grandes (LLM). Sin embargo, el aprendizaje es un proceso dinámico y el intercambio de conocimientos es fundamental. Si tiene recursos adicionales en mente que cree que deberían formar parte de esta lista completa, no dude en compartirlos en la sección de comentarios. Sus contribuciones podrían ser invaluables para otros en su viaje de aprendizaje, creando un espacio interactivo y colaborativo para el enriquecimiento del conocimiento.

Kanwal Mehreen es un aspirante a desarrollador de software con un gran interés en la ciencia de datos y las aplicaciones de IA en medicina. Kanwal fue seleccionado como Google Generation Scholar 2022 para la región APAC. A Kanwal le encanta compartir conocimientos técnicos escribiendo artículos sobre temas de actualidad y le apasiona mejorar la representación de las mujeres en la industria tecnológica.