Uma lista abrangente de recursos para dominar grandes modelos de linguagem - KDnuggets

Republicado por Platão

seguidores: 0

Uma lista abrangente de recursos para dominar grandes modelos de linguagem
Imagem gerada com Leonardo.Ai

Neste vasto cenário de IA, uma força revolucionária emergiu na forma de Large Language Models (LLMS). Não é apenas uma palavra da moda, mas o nosso futuro. A sua capacidade de compreender e gerar texto semelhante ao humano trouxe-os para o centro das atenções e agora tornou-se uma das áreas de investigação mais quentes. Imagine um chatbot que possa responder a você como se você estivesse conversando com seus amigos ou imagine um sistema de geração de conteúdo que torna difícil distinguir se foi escrito por um humano ou por uma IA. Se coisas como essa intrigam você e você deseja mergulhar ainda mais no coração dos LLMs, então você está no lugar certo. Reuni uma lista abrangente de recursos que vão desde artigos informativos, cursos e repositórios GitHub até artigos de pesquisa relevantes que podem ajudar você a entendê-los melhor. Sem mais delongas, vamos iniciar nossa incrível jornada no mundo dos LLMs.

Uma lista abrangente de recursos para dominar grandes modelos de linguagem
Imagem por Polina Tankilevich em Pexels

1. Especialização em Aprendizado Profundo – Coursera

link: Especialização em Aprendizagem Profunda

Descrição: O aprendizado profundo constitui a espinha dorsal dos LLMs. Este curso abrangente ministrado por Andrew Ng cobre os tópicos essenciais de redes neurais, os conceitos básicos de visão computacional e processamento de linguagem natural e como estruturar seus projetos de aprendizado de máquina.

2. Stanford CS224N: PNL com aprendizado profundo – YouTube

link: Stanford CS224N: PNL com aprendizado profundo

Descrição: É uma mina de ouro de conhecimento e fornece uma introdução completa à pesquisa de ponta em aprendizagem profunda para PNL.

3. Curso de Transformadores HuggingFace – HuggingFace

link: Curso de Transformadores HuggingFace

Descrição: Este curso ensina PNL usando bibliotecas do ecossistema HuggingFace. Ele cobre o funcionamento interno e o uso das seguintes bibliotecas do HuggingFace:

transformadores
Tokenizadores
Conjuntos de dados
Acelerar

4. Engenharia de prompt ChatGPT para desenvolvedores – Coursera

link: Curso de Engenharia Prompt ChatGPT

Descrição: ChatGPT é um LLM popular e este curso compartilha as melhores práticas e os princípios essenciais para escrever prompts eficazes para melhor geração de respostas.

Uma lista abrangente de recursos para dominar grandes modelos de linguagem
Imagem gerada com Leonardo.Ai

1. Universidade LLM - Cohere

link: Universidade LLM

Descrição: Cohere oferece um curso especializado para dominar LLMs. Sua trilha sequencial, que cobre detalhadamente os aspectos teóricos da PNL, LLMs e sua arquitetura, é voltada para iniciantes. Seu caminho não sequencial é para indivíduos experientes, mais interessados nas aplicações práticas e nos casos de uso desses modelos poderosos, em vez de em seu funcionamento interno.

2. Stanford CS324: Grandes Modelos de Linguagem – Site Stanford

link: Stanford CS324: grandes modelos de linguagem

Descrição: Este curso se aprofunda nas complexidades desses modelos. Você explorará os fundamentos, a teoria, a ética e os aspectos práticos desses modelos, ao mesmo tempo que ganhará alguma experiência prática.

3. Princeton COS597G: Compreendendo grandes modelos de linguagem – Site de Princeton

link: Compreendendo grandes modelos de linguagem

Descrição: É um curso de pós-graduação que oferece um currículo abrangente, sendo uma excelente opção para um aprendizado aprofundado. Você explorará os fundamentos técnicos, capacidades e limitações de modelos como modelos BERT, GPT, T5, modelos de mistura de especialistas, modelos baseados em recuperação, etc.

4. ETH Zurique: Grandes Modelos de Linguagem (LLMs) – RycoLab

link: ETH Zurique: grandes modelos de linguagem

Descrição: Este curso recém-projetado oferece uma exploração abrangente de LLMs. Mergulhe nos fundamentos probabilísticos, modelagem de redes neurais, processos de treinamento, técnicas de escalonamento e discussões críticas sobre segurança e possível uso indevido.

5. Full Stack LLM Bootcamp – O Full Stack

link: Bootcamp LLM Full Stack

Descrição: O boot camp Full Stack LLM é um curso relevante para o setor que cobre tópicos como técnicas de engenharia imediata, fundamentos do LLM, estratégias de implantação e design de interface do usuário, garantindo que os participantes estejam bem preparados para construir e implantar aplicativos LLM.

6. Ajuste fino de modelos de grandes linguagens – Coursera

link: Ajuste fino de modelos de linguagem grande

Descrição: O Fine Tuning é a técnica que permite adaptar os LLMs às suas necessidades específicas. Ao concluir este curso, você entenderá quando aplicar o ajuste fino, a preparação de dados para o ajuste fino e como treinar seu LLM em novos dados e avaliar seu desempenho.

Uma lista abrangente de recursos para dominar grandes modelos de linguagem
Imagem gerada com Leonardo.Ai

1. O que o ChatGPT está fazendo… e por que funciona? –Steven Wolfram

link: O que o ChatGPT está fazendo… e por que funciona?

Descrição: Este pequeno livro foi escrito por Steven Wolfram, um renomado cientista. Ele discute os aspectos fundamentais do ChatGPT, suas origens nas redes neurais e seus avanços em transformadores, mecanismos de atenção e processamento de linguagem natural. É uma excelente leitura para quem está interessado em explorar as capacidades e limitações dos LLMs.

2. Compreendendo grandes modelos de linguagem: uma lista de leitura transformadora – Sebastian Raschka

link: Compreendendo grandes modelos de linguagem: uma lista de leitura transformadora

Descrição: Ele contém uma coleção de artigos de pesquisa importantes e fornece uma lista de leitura cronológica, desde os primeiros artigos sobre redes neurais recorrentes (RNNs) até o influente modelo BERT e muito mais. É um recurso inestimável para pesquisadores e profissionais estudarem a evolução da PNL e dos LLMs.

3. Série de Artigos: Grandes Modelos de Linguagem – Jay Alammar

link: Série de artigos: grandes modelos de linguagem

Descrição: Os blogs de Jay Alammar são um tesouro de conhecimento para quem estuda grandes modelos de linguagem (LLMs) e transformadores. Seus blogs se destacam pela combinação única de visualizações, explicações intuitivas e cobertura abrangente do assunto.

4. Construindo Aplicações LLM para Produção – Chip Huyen

link: Construindo aplicativos LLM para produção

Descrição: Neste artigo, são discutidos os desafios da produção de LLMs. Ele oferece insights sobre a capacidade de composição de tarefas e apresenta casos de uso promissores. Qualquer pessoa interessada em LLMs práticos achará isso realmente valioso.

Uma lista abrangente de recursos para dominar grandes modelos de linguagem
Imagem por RealToughCandy. com em Pexels

1. Incrível-LLM (9k ⭐)

link: Incrível-LLM

Descrição: É uma coleção com curadoria de artigos, estruturas, ferramentas, cursos, tutoriais e recursos focados em grandes modelos de linguagem (LLMs), com ênfase particular em ChatGPT.

2. Guia Prático LLMs (6.9k ⭐)

link: Os guias práticos para grandes modelos de linguagem

Descrição: Ajuda os profissionais a navegar no amplo cenário dos LLMs. É baseado no documento de pesquisa intitulado: Aproveitando o poder dos LLMs na prática: uma pesquisa sobre ChatGPT e muito mais e isto blog.

3. LMSurvey (6.1k ⭐)

link: LMS Pesquisa

Descrição: É uma coleção de documentos de pesquisa e recursos baseados no artigo intitulado: Uma pesquisa de grandes modelos de linguagem. Contém também uma ilustração da evolução técnica dos modelos da série GPT, bem como um gráfico evolutivo do trabalho de pesquisa realizado no LLaMA.

4. Gráfico incrível-LLM (637 ⭐)

link: Gráfico incrível-LLM

Descrição: É uma fonte valiosa para pessoas interessadas na intersecção de técnicas baseadas em gráficos com LLMs. ele fornece uma coleção de artigos de pesquisa, conjuntos de dados, benchmarks, pesquisas e ferramentas que se aprofundam neste campo emergente.

5. Langchain incrível (5.4k ⭐)

link: incrível-langchain

Descrição: LangChain é a estrutura rápida e eficiente para projetos LLM e este repositório é o centro para rastrear iniciativas e projetos relacionados ao ecossistema LangChain.

"Uma pesquisa completa sobre ChatGPT na era AIGC” – É um ótimo ponto de partida para iniciantes em LLMs. Ele cobre de forma abrangente a tecnologia, os aplicativos e os desafios subjacentes do ChatGPT.
"Uma pesquisa de grandes modelos de linguagem”- Abrange os avanços recentes em LLMs especificamente nos quatro aspectos principais de pré-treinamento, ajuste de adaptação, utilização e avaliação de capacidade.
"Desafios e aplicações de grandes modelos de linguagem”- Discute os desafios dos LLMs e as áreas de aplicação bem-sucedidas dos LLMs.
"Atenção É Tudo Que Você Precisa”- Os transformadores servem como base para GPT e outros LLMs e este artigo apresenta a arquitetura do Transformer.
"O transformador anotado”- Um recurso da Universidade de Harvard que fornece uma explicação detalhada e anotada da arquitetura do Transformer, que é fundamental para muitos LLMs.
"O transformador ilustrado” – Um guia visual que ajuda você a entender a arquitetura do Transformer em profundidade, tornando conceitos complexos mais acessíveis.
"BERT: Pré-treinamento de transformadores bidirecionais profundos para compreensão de idiomas”- Este artigo apresenta o BERT, um LLM altamente influente que estabelece novos padrões para inúmeras tarefas de Processamento de Linguagem Natural (PNL).

Neste artigo, organizei uma extensa lista de recursos essenciais para dominar Large Language Models (LLMs). No entanto, a aprendizagem é um processo dinâmico e a partilha de conhecimento está no seu cerne. Se você tiver recursos adicionais em mente que acredita que deveriam fazer parte desta lista abrangente, não hesite em compartilhá-los na seção de comentários. Suas contribuições podem ser inestimáveis para outras pessoas em sua jornada de aprendizagem, criando um espaço interativo e colaborativo para enriquecimento de conhecimento.

Kanwal Mehreen é um aspirante a desenvolvedor de software com grande interesse em ciência de dados e aplicações de IA na medicina. Kanwal foi selecionado como o Google Generation Scholar 2022 para a região APAC. Kanwal adora compartilhar conhecimento técnico escrevendo artigos sobre tópicos de tendências e é apaixonado por melhorar a representação das mulheres na indústria de tecnologia.