5 tasuta raamatut loomuliku keele töötlemise kohta, mida lugeda 2023. aastal – KDnuggets

5 tasuta raamatut loomuliku keele töötlemise kohta, mida lugeda 2023. aastal – KDnuggets

Allikasõlm: 2744384

5 tasuta raamatut loomuliku keele töötlemise kohta, mida lugeda 2023. aastal
Pilt autorilt
 

Enne suurte keelemudelite (LLM-ide) ümber puhkemist oli NLP ehitamas, kuid edenes varitsemisel. Nüüd on see muutunud revolutsiooniliseks pärast LLM-ide, nagu ChatGPT, väljaandmist. On näidatud, et LLM-id mõistavad ja genereerivad inimesesarnast teksti. Mudeleid, nagu ChatGPT, Google Bard ja palju muud, on õpetatud kasutama suures mahus tekstiandmeid sügavas närvivõrgu arhitektuuris. 

Kuid kuidas need mudelid inimesi täpselt mõistavad ja inimlikke reaktsioone väljastavad? NLP. Tehisintellekti alamvaldkond, mis aitab modelleerida inimkeelt töödelda, mõista ja väljastada. Tavaliselt koolitatakse neid selliste ülesannete täitmiseks nagu järgmise sõna ennustamine, mis võimaldab neil luua kontekstipõhiseid sõltuvusi ja seejärel luua asjakohaseid väljundeid. NLP-väljal on täiustatud rakendused, nagu vestlusrobotid, teksti kokkuvõtted ja palju muud. 

LLM-ide ja nende kallutatusega teksti genereerimisel on mõned eetilised probleemid, mis käivitavad edasised uuringud NLP ja selle kasutamise kohta LLM-i rakendustes. Kuigi nende probleemide ja väljakutsetega tegeldakse praegu, kuid LLM-mudelid, nagu ChatGPT, on maailmale avaldanud – näib, et nad on siin, et jääda ja NLP mõistmine on hädavajalik. 

Kui soovite LLM-idest rohkem teada saada, peate õppima NLP kohta. Selles artiklis käsitlen 5 TASUTA raamatut, mida peate 2023. aastal lugema, et NLP-st paremini aru saada. 

autorid: Dan Jurafsky ja James H. Martin

Link: Kõne ja keele töötlemine

See kõne ja keeletöötluse raamat, mille on kirjutanud kaks ülikooli professorit, annab teile põhjaliku sissejuhatuse NLP maailma. See on jagatud kolmeks osaks: NLP põhialgoritmid, NLP-rakendused ja keelelise struktuuri märkuste tegemine. Esimene osa on oluline algajatele, et saada paremini aru, mis on NLP, selle alused koos näidetega, mis seda purustavad. Te puutute kokku mitmesuguste teemadega, nagu semantika, süntaks ja palju muud. 

Kui NLP valdkond on teile uus või soovite sellele valdkonnale üle minna, usun ma tõesti, et see raamat on inimese õppimisel väga kasulik. Nagu professorid kirjutasid, aitavad praktilised näited lugejatel mõistetest palju paremini aru saada kui puhtalt teoreetiline raamat. 

autorid: Christopher D. Manning ja Hinrich Schütze

Link: Statistilise loomuliku keele töötlemise alused

Kui olete andmeprofessionaal või tehisintellekti maailmas, siis teate, kui oluline on statistika valdkonna jaoks. Mõned usuvad, et te ei nõua sektori kõrget tundmist, kuid minu arvates on see oluline, kuna see muudab teie andmetega seotud professionaalse teekonna palju sujuvamaks. 

Kui teil on NLP-valdkonna kohta hea alus, võite mõelda, et järgmiseks sammuks on algoritmide tundmaõppimine. Enne seda soovite rohkem teada saada keele matemaatiliste aluste kohta. See raamat ei alusta ainult NLP põhitõdedega, vaid sukeldub matemaatilisse aspekti, nagu tõenäosusruumid, Bayesi teoreem, dispersioon ja palju muud. 

Autor: Christopher M. Bishop

Link: Mustri tuvastamine ja masinõpe

Parim viis mudelite toimivuse mõistmiseks on mõista, kuidas mudel töötab, selle mõttekäiku, mustrituvastust ja seda, miks see seda teeb. Mustrituvastus on andmete eristamise protsess, mis põhineb spetsiaalsete algoritmide abil määratud kriteeriumidel. See võimaldab õppida ja annab arenguruumi, mis muudab masinõppe algoritmide ja nende toimimise väga oluliseks. 

Iga peatüki lõpus on harjutus, mis on valitud iga mõiste paremaks selgitamiseks lugejale. Autor hoidis matemaatilise sisu minimaalsena, et aidata lugejal paremini aru saada, kuid märgitakse, et mustrituvastuse ja masinõppe tehnikate mõistmiseks on kasulik omada arvutust, lineaaralgebrat ja tõenäosusteooriat. 

Autor: Yoav Goldberg

Link: Närvivõrgu meetodid NLP-s

Vaadeldes NLP kasvu, võime öelda, et närvivõrgud on mänginud suurt rolli. Närvivõrgud on pakkunud NLP-mudelitele paremat arusaamist inimkeelest, võimaldades neil ennustada sõnu ja jaotada erinevaid teemasid, mida nad õppimise ajal ei näinud. 

See raamat ei sukeldu kohe närvivõrkude läbi ja lõhki. See algab põhitõdede õppimisega, nagu lineaarsed mudelid, pertseptronid, edasisuunamine, närvivõrgu koolitus ja palju muud. Nende põhielementide selgitamiseks on autor kasutanud matemaatilist lähenemist koos praktiliste näidetega.

autorid: Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta ja Harshit Surana

Link: Praktiline loomuliku keele töötlemine 

Nii et olete aru saanud kõnest ja keelest, olete käsitlenud statistilist NLP-d, seejärel vaadanud NLP-s mustrituvastust ja närvivõrke. Viimane asi, mida peate õppima, on NLP praktiline kasutamine. 

Selles raamatus kirjeldatakse, kuidas NLP-d reaalses maailmas kasutatakse, NLP-mudelite konveierit ja rohkem teavet tekstiandmete ja kasutusjuhtude kohta, nagu näiteks vestlusrobotid nagu ChatGPT. Sellest raamatust saate teada, kuidas NLP-d saab kasutada erinevates sektorites, nagu jaekaubandus, tervishoid, rahandus ja palju muud. Erinevate sektorite abil saate hinnata, kuidas NLP-konveier töötab igas sektoris, ja saate aru, kuidas seda ise kasutada. 

Selle artikli eesmärk ja voog oli pakkuda teile 5 tasuta raamatut, mis minu arvates on olulised ja toovad kasu teie NLP karjäärile või õppimisele. Kuigi ma tegin seda struktuurvormingus, loodan, et iga raamat põrkab teist tagasi, viies teie õppimise järgmisele tasemele.

Kui teil on muid TASUTA NLP-raamatuid, millest arvate, et teistele kasu võiks saada, kirjutage need kommentaaridesse!
 
 
Nisha Arya on andmeteadlane, vabakutseline tehniline kirjanik ja kogukonnajuht ettevõttes KDnuggets. Ta on eriti huvitatud andmeteaduse karjäärinõustamise või õpetuste ja teooriapõhiste teadmiste pakkumisest andmeteaduse kohta. Samuti soovib ta uurida erinevaid viise, kuidas tehisintellekt on/võib aidata kaasa inimelu pikaealisusele. Innukas õppija, kes soovib laiendada oma tehnilisi teadmisi ja kirjutamisoskusi, aidates samal ajal teisi juhendada.
 

Ajatempel:

Veel alates KDnuggets