Imagen generada con Leonardo.Ai
En este vasto panorama de la IA, surgió una fuerza revolucionaria en forma de modelos de lenguaje grandes (LLMS). No es sólo una palabra de moda sino nuestro futuro. Su capacidad para comprender y generar textos similares a los humanos los puso en el centro de atención y ahora se ha convertido en una de las áreas de investigación más candentes. Imagine un chatbot que pueda responderle como si estuviera hablando con sus amigos o imagine un sistema de generación de contenido que resulte difícil distinguir si está escrito por un humano o una IA. Si cosas como esta te intrigan y quieres profundizar más en el corazón de los LLM, entonces estás en el lugar correcto. He reunido una lista completa de recursos que van desde artículos informativos, cursos y repositorios de GitHub hasta artículos de investigación relevantes que pueden ayudarlo a comprenderlos mejor. Sin más demora, comencemos nuestro increíble viaje en el mundo de los LLM.
Imagen de Polina Tankilevitch en Pexels
1. Especialización en aprendizaje profundo - Coursera
Enlace: Especialización de aprendizaje profundo
Descripción: El aprendizaje profundo constituye la columna vertebral de los LLM. Este curso integral impartido por Andrew Ng cubre los temas esenciales de las redes neuronales, los conceptos básicos de la visión por computadora y el procesamiento del lenguaje natural, y cómo estructurar sus proyectos de aprendizaje automático.
2. Stanford CS224N: PNL con aprendizaje profundo – YouTube
Enlace: Stanford CS224N: PNL con aprendizaje profundo
Descripción: Es una mina de oro de conocimiento y proporciona una introducción exhaustiva a la investigación de vanguardia en aprendizaje profundo para PNL.
3. Curso de transformadores de HuggingFace - HuggingFace
Enlace: Curso de Transformers de HuggingFace
Descripción: Este curso enseña PNL utilizando bibliotecas del ecosistema HuggingFace. Cubre el funcionamiento interno y el uso de las siguientes bibliotecas de HuggingFace:
- Transformers
- Tokenizadores
- Conjuntos de datos
- Accelerate
4. Ingeniería de mensajes ChatGPT para desarrolladores – Coursera
Enlace: Curso de ingeniería rápida ChatGPT
Descripción: ChatGPT es un LLM popular y este curso comparte las mejores prácticas y los principios esenciales para redactar indicaciones efectivas para generar una mejor respuesta.
Imagen generada con Leonardo.Ai
1. Universidad LLM - Cohere
Enlace: Universidad LLM
Descripción: Cohere ofrece un curso especializado para dominar los LLM. Su seguimiento secuencial, que cubre en detalle los aspectos teóricos de la PNL, los LLM y su arquitectura, está dirigido a principiantes. Su camino no secuencial es para personas con experiencia interesadas más en las aplicaciones prácticas y los casos de uso de estos poderosos modelos que en su funcionamiento interno.
2. Stanford CS324: Modelos de lenguajes grandes - Sitio de Stanford
Enlace: Stanford CS324: modelos de lenguaje grandes
Descripción: Este curso profundiza en las complejidades de estos modelos. Explorará los fundamentos, la teoría, la ética y los aspectos prácticos de estos modelos y, al mismo tiempo, obtendrá experiencia práctica.
3. Princeton COS597G: Comprensión de los modelos de lenguaje grandes – Sitio de Princeton
Enlace: Comprender los modelos de lenguaje grandes
Descripción: Es un curso de posgrado que ofrece un plan de estudios integral, lo que lo convierte en una excelente opción para un aprendizaje en profundidad. Explorará los fundamentos técnicos, las capacidades y las limitaciones de modelos como BERT, GPT, modelos T5, modelos de combinación de expertos, modelos basados en recuperación, etc.
4. ETH Zurich: Modelos de lenguajes grandes (LLM) - RycoLab
Enlace: ETH Zurich: modelos de lenguaje grandes
Descripción: Este curso recientemente diseñado ofrece una exploración integral de los LLM. Profundice en fundamentos probabilísticos, modelado de redes neuronales, procesos de capacitación, técnicas de escalamiento y debates críticos sobre seguridad y posibles usos indebidos.
5. Bootcamp LLM de pila completa: la pila completa
Enlace: Curso intensivo de LLM de pila completa
Descripción: El campo de entrenamiento Full Stack LLM es un curso relevante para la industria que cubre temas como técnicas de ingeniería rápida, fundamentos de LLM, estrategias de implementación y diseño de interfaz de usuario, lo que garantiza que los participantes estén bien preparados para crear e implementar aplicaciones de LLM.
6. Ajuste fino de modelos de lenguajes grandes – Coursera
Enlace: Ajuste fino de modelos de lenguaje grande
Descripción: Fine Tuning es la técnica que le permite adaptar los LLM a sus necesidades específicas. Al completar este curso, comprenderá cuándo aplicar el ajuste, la preparación de datos para el ajuste y cómo capacitar a su LLM con nuevos datos y evaluar su desempeño.
Imagen generada con Leonardo.Ai
1. ¿Qué hace ChatGPT... y por qué funciona? -Steven Wolfram
Enlace: ¿Qué hace ChatGPT... y por qué funciona?
Descripción: Este breve libro está escrito por Steven Wolfram, un científico de renombre. Analiza los aspectos fundamentales de ChatGPT, sus orígenes en las redes neuronales y sus avances en transformadores, mecanismos de atención y procesamiento del lenguaje natural. Es una lectura excelente para alguien interesado en explorar las capacidades y limitaciones de los LLM.
2. Comprensión de los modelos de lenguaje grandes: una lista de lectura transformadora – Sebastian Raschka
Enlace: Comprensión de modelos de lenguaje grandes: una lista de lectura transformadora
Descripción: Contiene una colección de artículos de investigación importantes y proporciona una lista de lecturas cronológicas, desde los primeros artículos sobre redes neuronales recurrentes (RNN) hasta el influyente modelo BERT y más allá. Es un recurso invaluable para que investigadores y profesionales estudien la evolución de la PNL y los LLM.
3. Serie de artículos: Modelos de lenguajes grandes - Jay Alammar
Enlace: Serie de artículos: Modelos de lenguaje grandes
Descripción: Los blogs de Jay Alammar son un tesoro de conocimientos para cualquiera que estudie modelos de lenguajes grandes (LLM) y transformadores. Sus blogs se destacan por su combinación única de visualizaciones, explicaciones intuitivas y cobertura integral del tema.
4. Creación de aplicaciones LLM para producción: Chip Huyen
Enlace: Creación de aplicaciones LLM para producción
Descripción: En este artículo, se analizan los desafíos de producir LLM. Ofrece información sobre la componibilidad de tareas y muestra casos de uso prometedores. Cualquier persona interesada en LLM prácticos lo encontrará realmente valioso.
Imagen de RealToughCandy.com en Pexels
1. Impresionante-LLM (9k ⭐)
Enlace: Impresionante-LLM
Descripción: Es una colección curada de artículos, marcos, herramientas, cursos, tutoriales y recursos centrados en modelos de lenguajes grandes (LLM), con especial énfasis en ChatGPT.
2. Guía práctica de LLM (6.9k ⭐)
Enlace: Las guías prácticas para modelos de lenguaje grandes
Descripción: Ayuda a los profesionales a navegar por el amplio panorama de los LLM. Se basa en el documento de encuesta titulado: Aprovechar el poder de los LLM en la práctica: una encuesta sobre ChatGPT y más allá y así blog.
3. Encuesta LLM (6.1k ⭐)
Enlace: Encuesta LLM
Descripción: Es una colección de artículos de encuesta y recursos basados en el artículo titulado: Una encuesta de modelos de lenguaje grande. También contiene una ilustración de la evolución técnica de los modelos de la serie GPT, así como un gráfico evolutivo del trabajo de investigación realizado en LLaMA.
4. Awesome Graph-LLM (637 ⭐)
Enlace: Awesome-Graph-LLM
Descripción: Es una fuente valiosa para las personas interesadas en la intersección de técnicas basadas en gráficos con LLM. proporciona una colección de artículos de investigación, conjuntos de datos, puntos de referencia, encuestas y herramientas que profundizan en este campo emergente.
5. Impresionante Langchain (5.4k ⭐)
Enlace: impresionante-langchain
Descripción: LangChain es el marco rápido y eficiente para proyectos LLM y este repositorio es el centro para rastrear iniciativas y proyectos relacionados con el ecosistema de LangChain.
- "Una encuesta completa sobre ChatGPT en la era AIGC” – Es un excelente punto de partida para principiantes en LLM. Cubre de manera integral la tecnología, las aplicaciones y los desafíos subyacentes de ChatGPT.
- "Una encuesta de modelos de lenguaje grande”- Cubre los avances recientes en los LLM específicamente en los cuatro aspectos principales de capacitación previa, ajuste de adaptación, utilización y evaluación de capacidad.
- "Desafíos y aplicaciones de modelos de lenguaje grandes”- Analiza los desafíos de los LLM y las áreas de aplicación exitosas de los LLM.
- "La atención es todo lo que necesitas”- Los transformadores sirven como piedra angular para GPT y otros LLM y este documento presenta la arquitectura Transformer.
- "El transformador anotado”: un recurso de la Universidad de Harvard que proporciona una explicación detallada y comentada de la arquitectura Transformer, que es fundamental para muchos LLM.
- "El transformador ilustrado” – Una guía visual que le ayuda a comprender en profundidad la arquitectura de Transformer, haciendo que los conceptos complejos sean más accesibles.
- "BERT: pre-entrenamiento de transformadores bidireccionales profundos para la comprensión del lenguaje” – Este artículo presenta BERT, un LLM muy influyente que establece nuevos puntos de referencia para numerosas tareas de procesamiento del lenguaje natural (NLP).
En este artículo, he seleccionado una lista extensa de recursos esenciales para dominar los modelos de lenguajes grandes (LLM). Sin embargo, el aprendizaje es un proceso dinámico y el intercambio de conocimientos es fundamental. Si tiene recursos adicionales en mente que cree que deberían formar parte de esta lista completa, no dude en compartirlos en la sección de comentarios. Sus contribuciones podrían ser invaluables para otros en su viaje de aprendizaje, creando un espacio interactivo y colaborativo para el enriquecimiento del conocimiento.
Kanwal Mehreen es un aspirante a desarrollador de software con un gran interés en la ciencia de datos y las aplicaciones de IA en medicina. Kanwal fue seleccionado como Google Generation Scholar 2022 para la región APAC. A Kanwal le encanta compartir conocimientos técnicos escribiendo artículos sobre temas de actualidad y le apasiona mejorar la representación de las mujeres en la industria tecnológica.
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
- PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
- PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
- PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
- Fuente: https://www.kdnuggets.com/a-comprehensive-list-of-resources-to-master-large-language-models?utm_source=rss&utm_medium=rss&utm_campaign=a-comprehensive-list-of-resources-to-master-large-language-models
- :posee
- :es
- :no
- 2022
- 4k
- a
- capacidad
- Nuestra Empresa
- accesible
- adaptar
- adaptaciónes
- Adicionales
- avances
- avances
- AI
- IA en medicina
- aigc
- Todos
- permite
- también
- las increíbles ofertas de
- an
- y
- Andrés
- andrew ng
- cualquier
- nadie
- APAC
- Aplicación
- aplicaciones
- Aplicá
- arquitectura
- somos
- áreas
- artículo
- AS
- aspectos
- aspirantes
- At
- Columna vertebral
- basado
- conceptos básicos
- BE
- a las que has recomendado
- se convierte en
- Principiantes
- CREEMOS
- los puntos de referencia
- MEJOR
- y las mejores prácticas
- mejores
- Más allá de
- Blend
- Blog
- Blogs
- primer libro
- Traído
- build
- Construir la
- pero
- palabra pegadiza
- by
- Acampar
- PUEDEN
- capacidades
- Capacidad
- cases
- retos
- chatterbot
- ChatGPT
- chip
- manera?
- colaboración
- --
- comentario
- completar
- completando
- integraciones
- exhaustivo
- computadora
- Visión por computador
- conceptos
- llevado a cabo
- contiene
- contenido
- contribuciones
- podría
- curso
- Coursera
- cursos
- cobertura
- cubre suministros para
- Creamos
- crítico
- cs
- comisariada
- Curriculum
- innovador
- datos
- Preparación de datos
- Ciencia de los datos
- conjuntos de datos
- profundo
- deep learning
- más profundo
- aprendizaje profundo
- retrasar
- ahondar
- desplegar
- despliegue
- profundidad
- Diseño
- diseñado
- detalle
- detallado
- Developer
- desarrolladores
- difícil
- discutido
- discusiones
- distinguir
- inmersión
- sí
- "Hacer"
- don
- lugar de trabajo dinámico
- Temprano en la
- ecosistema
- Eficaz
- eficiente
- surgido
- emergentes
- énfasis
- Ingeniería
- asegurando que
- imaginar
- esencial
- etc.
- ETH
- ETH Zurich
- ética
- evaluar
- evaluación
- evolución
- excelente,
- expansivo
- experience
- experimentado
- explicación
- exploración
- explorar
- Explorar
- en los detalles
- RÁPIDO
- campo
- Encuentre
- en fin
- centrado
- siguiendo
- FORCE
- formulario
- Formularios
- Fundación
- Fundamentos
- Digital XNUMXk
- Marco conceptual
- marcos
- amigos
- Desde
- ser completados
- Completa pila
- fundamental
- Las Bases (Fundamentales)
- promover
- futuras
- ganando
- reunido
- generar
- generado
- generación de AHSS
- GitHub
- gráfica
- maravillosa
- guía
- Guías
- emprendedor
- harvard
- Universidad de Harvard
- Tienen
- he
- Corazón
- ayuda
- ayuda
- altamente
- su
- más caliente
- Cómo
- Como Hacer
- Sin embargo
- HTML
- http
- HTTPS
- Bujes
- AbrazandoCara
- humana
- i
- if
- imagen
- importante
- la mejora de
- in
- a fondo
- individuos
- energético
- Influyente
- informativo
- iniciativas
- Insights
- interactivo
- intereses
- interesado
- Interfaz
- interno
- intersección
- dentro
- complejidades
- Presenta
- Introducción
- intuitivo
- inestimable
- IT
- SUS
- jpg
- solo
- nuggets
- Keen
- especialistas
- paisaje
- idioma
- large
- aprendizaje
- dejar
- bibliotecas
- como
- limitaciones
- Etiqueta LinkedIn
- Lista
- Llama
- ama
- máquina
- máquina de aprendizaje
- gran
- Realizar
- muchos
- dominar
- masterización
- Materia
- los mecanismos de
- medicina
- mente
- mal uso
- modelo
- modelado
- modelos
- más,
- Natural
- Lenguaje natural
- Procesamiento natural del lenguaje
- Navegar
- Nets
- del sistema,
- telecomunicaciones
- Neural
- red neural
- redes neuronales
- Nuevo
- recién
- nlp
- ahora
- numeroso
- of
- Ofertas
- on
- ONE
- or
- las orígenes
- Otro
- Otros
- nuestros
- salir
- Papel
- papeles
- parte
- Participantes
- particular
- apasionado
- camino
- Personas
- actuación
- Colocar
- Platón
- Inteligencia de datos de Platón
- PlatónDatos
- Por favor
- punto
- Popular
- posible
- industria
- poderoso
- Metodología
- Aplicaciones Prácticas
- prácticas
- preparación
- princeton
- principios
- en costes
- tratamiento
- Producción
- proyecta
- prometedor
- ideas
- proporciona un
- que van
- más bien
- Leer
- Reading
- realmente
- reciente
- recurrente
- región
- relacionado
- Renombrado
- repositorio
- representación
- la investigación
- investigadores
- Recurso
- Recursos
- Responder
- respuesta
- revolucionario
- Derecho
- s
- la ampliación
- Estudiante
- Ciencia:
- Científico
- Sección
- EN LINEA
- seleccionado
- Serie
- ayudar
- Sets
- Compartir
- Acciones
- En Corto
- tienes
- Software
- algo
- Alguien
- Fuente
- Espacio
- especializado
- soluciones y
- específicamente
- Spotlight
- montón
- stand
- stanford
- Comience a
- Steven
- STONE
- estrategias
- estructura
- ESTUDIO
- Estudiando
- sujeto
- exitosos
- tal
- Peritaje
- te
- T
- hablar
- afectados
- Tarea
- tareas
- enseñó
- tecnología
- industria de la tecnología
- Técnico
- la técnica
- técnicas
- Tecnología
- texto
- que
- esa
- La
- Lo esencial
- el centro
- el mundo
- su
- Les
- luego
- teorético
- teoría
- Estas
- cosas
- así
- titulada
- a
- Temas
- hacia
- seguir
- Entrenar
- Formación
- transformador
- transformador
- transformers
- tendencias
- Tutoriales
- subyacente
- entender
- comprensión
- único
- universidad
- Uso
- utilizan el
- Usuario
- Interfaz de usuario
- diseño de interfaz de usuario
- usando
- Valioso
- Vasto
- Ve
- visión
- visual
- quieres
- fue
- WELL
- ¿
- Que es
- cuando
- sean
- que
- mientras
- porque
- seguirá
- sin
- Mujeres
- mujeres en tecnología
- Actividades:
- trabajando
- labores
- mundo
- escribir
- la escritura
- escrito
- Usted
- tú
- zephyrnet
- Zúrich