5 livres gratuits sur le traitement du langage naturel à lire en 2023 - KDnuggets

5 livres gratuits sur le traitement du langage naturel à lire en 2023 – KDnuggets

Nœud source: 2744384

5 livres gratuits sur le traitement automatique du langage naturel à lire en 2023
Image par auteur
 

Avant le battage médiatique autour des grands modèles de langage (LLM), la PNL se construisait mais progressait dans l'ombre. Maintenant, il est devenu révolutionné depuis la sortie de LLM tels que ChatGPT. Il a été démontré que les LLM comprennent et génèrent un texte de type humain. Des modèles tels que ChatGPT, Google Bard et bien d'autres ont été formés sur de gros volumes de données textuelles dans une architecture de réseau neuronal profond. 

Mais comment ces modèles comprennent-ils exactement les humains et produisent-ils des réponses de type humain ? PNL. Un sous-domaine de l'intelligence artificielle qui aide les modèles à traiter, comprendre et produire le langage humain. Ils sont généralement formés à des tâches telles que la prédiction du mot suivant, ce qui leur permet de créer des dépendances contextuelles, puis de générer des sorties pertinentes. Le domaine NLP dispose d'applications avancées telles que les chatbots, la synthèse de texte, etc. 

Il existe certaines préoccupations éthiques concernant les LLM et leur biais dans la génération de texte, suscitant de nouvelles recherches sur la PNL et son utilisation dans les applications LLM. Bien que ces préoccupations et défis soient actuellement abordés, avec l'impact que les modèles LLM tels que ChatGPT ont eu sur le monde, il semble qu'ils soient là pour rester et comprendre la PNL sera essentiel. 

Si vous voulez en savoir plus sur les LLM, vous devez en savoir plus sur la PNL. Dans cet article, je passerai en revue 5 livres GRATUITS que vous devez lire en 2023 pour mieux comprendre la PNL. 

Auteurs: Dan Jurafsky et James H. Martin

Lien : Traitement de la parole et du langage

Écrit par deux professeurs d'université, ce livre sur le traitement de la parole et du langage vous offre une introduction complète au monde de la PNL. Il est divisé en 3 sections : Algorithmes fondamentaux pour la PNL, Applications de la PNL et Annotation de la structure linguistique. La première section est essentielle aux débutants pour mieux comprendre ce qu'est la PNL, ses fondements avec des exemples qui la décomposent. Vous rencontrerez une gamme de sujets tels que la sémantique, la syntaxe, etc. 

Si le domaine de la PNL est nouveau pour vous ou si vous souhaitez faire la transition vers le domaine, je crois vraiment que ce livre sera très bénéfique pour l'apprentissage d'un individu. Comme il a été écrit par des professeurs, les exemples pratiques aident les lecteurs à mieux comprendre les concepts qu'un livre purement théorique. 

Auteurs: Christopher D. Manning et Hinrich Schütze

Lien : Fondements du traitement statistique du langage naturel

Si vous êtes un professionnel des données ou dans le monde de l'intelligence artificielle, vous saurez à quel point les statistiques sont importantes sur le terrain. Certains pensent que vous n'avez pas besoin d'une grande compréhension du secteur, mais je pense que c'est important car cela rendra votre parcours professionnel beaucoup plus fluide. 

Lorsque vous avez une bonne base sur le domaine de la PNL, vous pourriez penser que la prochaine étape consiste à en apprendre davantage sur les algorithmes. Avant cela, vous voudrez en savoir plus sur les fondements mathématiques du langage. Ce livre ne commence pas seulement par les bases de la PNL, il plonge dans les aspects mathématiques tels que les espaces de probabilité, le théorème de Bayes, la variance, etc. 

Auteur : Christophe M. Bishop

Lien : Reconnaissance des formes et apprentissage automatique

La meilleure façon de comprendre les performances des modèles est de comprendre comment le modèle fonctionne, son cheminement de pensée, la reconnaissance des formes et pourquoi il produit ce qu'il fait. La reconnaissance de formes est le processus de distinction des données en fonction d'un ensemble de critères exécutés par des algorithmes spéciaux. Elle permet l'apprentissage et permet une marge d'amélioration, ce qui la rend très importante pour les algorithmes d'apprentissage automatique et leurs performances. 

Chaque chapitre a un exercice à la fin qui a été choisi pour mieux expliquer chaque concept au lecteur. L'auteur a gardé le contenu mathématique au minimum pour aider le lecteur à mieux comprendre, mais il est à noter qu'il sera avantageux d'avoir une bonne compréhension du calcul, de l'algèbre linéaire et de la théorie des probabilités pour comprendre la reconnaissance des formes et les techniques d'apprentissage automatique. 

Auteur : Yoav Goldberg

Lien : Méthodes de réseau de neurones en PNL

En examinant la croissance de la PNL, nous pouvons dire que les réseaux de neurones ont joué un grand rôle. Les réseaux de neurones ont fourni aux modèles NLP une meilleure compréhension du langage humain, leur permettant de prédire des mots et de compartimenter différents sujets qui ne leur avaient pas été prévisualisés lors de leur apprentissage. 

Ce livre ne plonge pas tout de suite dans les tenants et les aboutissants des réseaux de neurones. Cela commence par l'apprentissage des bases telles que les modèles linéaires, les perceptrons, l'anticipation, la formation aux réseaux de neurones, etc. L'auteur a utilisé une approche mathématique pour expliquer ces éléments fondamentaux avec des exemples pratiques.

Auteurs: Sowmya Vajjala, Bodhisattva Majumder, Anuj Gupta et Harshit Surana

Lien : Traitement pratique du langage naturel 

Vous avez donc compris la parole et le langage, vous avez couvert la PNL statistique, puis vous avez examiné la reconnaissance des formes et les réseaux de neurones en PNL. La dernière chose que vous devez apprendre est l'utilisation pratique de la PNL. 

Ce livre explique comment la PNL est utilisée dans le monde réel, le pipeline des modèles de PNL, et plus sur les données textuelles et les cas d'utilisation, tels que les Chatbots comme ChatGPT. Dans ce livre, vous apprendrez comment la PNL peut être utilisée dans une variété de secteurs tels que la vente au détail, la santé, la finance, etc. Avec les différents secteurs, vous pourrez évaluer le fonctionnement du pipeline NLP pour chacun et savoir comment l'utiliser pour vous-même. 

Le but et le déroulement de cet article étaient de vous fournir 5 livres gratuits qui, à mon avis, sont essentiels et qui profiteront à votre carrière ou à vos études en PNL. Bien que je l'aie fait dans un format structuré, j'espère que chaque livre rebondit sur l'autre, faisant passer vos études au niveau supérieur.

S'il existe d'autres livres GRATUITS sur la PNL dont vous pensez que d'autres pourraient bénéficier, veuillez les déposer dans les commentaires !
 
 
Nisha Arya est Data Scientist, rédacteur technique indépendant et Community Manager chez KDnuggets. Elle est particulièrement intéressée à fournir des conseils de carrière en science des données ou des tutoriels et des connaissances théoriques sur la science des données. Elle souhaite également explorer les différentes façons dont l'intelligence artificielle est/peut bénéficier à la longévité de la vie humaine. Une apprenante passionnée, cherchant à élargir ses connaissances techniques et ses compétences en écriture, tout en aidant à guider les autres.
 

Horodatage:

Plus de KDnuggetsGenericName