Îmbunătățirea modului în care utilizatorii descoperă conținut nou este esențială pentru a crește implicarea și satisfacția utilizatorilor pe platformele media. Numai căutarea prin cuvinte cheie are provocări în capturarea semanticii și a intenției utilizatorului, ceea ce duce la rezultate lipsite de context relevant; de exemplu, găsirea de filme cu tematică de Crăciun. Acest lucru poate duce la rate mai mici de reținere dacă utilizatorii nu pot găsi în mod fiabil conținutul pe care îl doresc. Cu toate acestea, cu modele lingvistice mari (LLM), există o oportunitate de a rezolva aceste provocări semantice și de intenție a utilizatorului. Prin combinare încastrări care captează semantica cu o tehnică numită Recuperare Augmented Generation (RAG), puteți genera răspunsuri mai relevante pe baza contextului preluat din propriile surse de date.
În această postare, vă arătăm cum să creați în siguranță un chatbot de film prin implementarea RAG cu propriile date folosind Baze de cunoștințe pentru Amazon Bedrock. Folosim setul de date IMDb și Box Office Mojo pentru a simula un catalog pentru clienții media și de divertisment și pentru a arăta cum vă puteți construi propria soluție RAG în doar câțiva pași.
Prezentare generală a soluțiilor
IMDb și Box Office Mojo Movies/TV/OTT pachetul de date cu licență oferă o gamă largă de metadate de divertisment, inclusiv peste 1.6 miliard de evaluări ale utilizatorilor; credite pentru mai mult de 13 milioane de membri ai distribuției și echipajului; 10 milioane de titluri de filme, TV și divertisment; și date de raportare la box office la nivel mondial din peste 60 de țări. Mulți clienți media și divertisment AWS licențiază datele IMDb prin Schimb de date AWS pentru a îmbunătăți descoperirea de conținut și pentru a crește implicarea și reținerea clienților.
Introducere în bazele de cunoștințe pentru Amazon Bedrock
Pentru a dota un LLM cu informații de proprietate actualizate, organizațiile folosesc RAG, o tehnică care implică preluarea datelor din sursele de date ale companiei și îmbogățirea promptului cu acele date pentru a oferi răspunsuri mai relevante și mai precise. Bazele de cunoștințe pentru Amazon Bedrock permit o capacitate RAG complet gestionată, care vă permite să personalizați răspunsurile LLM cu date contextuale și relevante ale companiei. Bazele de cunoștințe automatizează fluxul de lucru RAG de la capăt la capăt, inclusiv asimilarea, preluarea, creșterea rapidă și citarea, eliminând nevoia de a scrie cod personalizat pentru a integra sursele de date și a gestiona interogările. Bazele de cunoștințe pentru Amazon Bedrock permit, de asemenea, conversații în mai multe rânduri, astfel încât LLM să poată răspunde la întrebările complexe ale utilizatorilor cu răspunsul corect.
Utilizăm următoarele servicii ca parte a acestei soluții:
Parcurgem următorii pași de nivel înalt:
- Preprocesați datele IMDb pentru a crea documente din fiecare înregistrare de film și încărcați datele într-un Serviciul Amazon de stocare simplă Găleată (Amazon S3)
- Creați o bază de cunoștințe.
- Sincronizați baza de cunoștințe cu sursa de date.
- Utilizați baza de cunoștințe pentru a răspunde la întrebări semantice despre catalogul de filme.
Cerințe preliminare
Datele IMDb utilizate în această postare necesită o licență de conținut comercial și un abonament plătit la pachetul de licențe IMDb și Box Office Mojo Movies/TV/OTT pe AWS Data Exchange. Pentru a solicita informații despre o licență și pentru a accesa date mostre, vizitați developer.imdb.com. Pentru a accesa setul de date, consultați Recomandare de putere și căutare folosind un grafic de cunoștințe IMDb - Partea 1 și urmați Accesați datele IMDb secţiune.
Preprocesează datele IMDb
Înainte de a crea o bază de cunoștințe, trebuie să preprocesăm setul de date IMDb în fișiere text și să le încărcăm într-un bucket S3. În această postare, simulăm un catalog de clienți utilizând setul de date IMDb. Luăm 10,000 de filme populare din setul de date IMDb pentru catalog și construim setul de date.
Foloseste urmatoarele caiet pentru a crea setul de date cu informații suplimentare, cum ar fi numele actorilor, regizorilor și producătorilor. Folosim următorul cod pentru a crea un singur fișier pentru un film cu toate informațiile stocate în fișier într-un text nestructurat care poate fi înțeles de către LLM:
După ce aveți datele în format .txt, puteți încărca datele în Amazon S3 utilizând următoarea comandă:
Creați baza de cunoștințe IMDb
Parcurgeți următorii pași pentru a vă crea baza de cunoștințe:
- Pe consola Amazon Bedrock, alegeți Bază de cunoștințe în panoul de navigare.
- Alege Creați o bază de cunoștințe.
- Pentru Numele bazei de cunoștințe, introduce
imdb
. - Pentru Descrierea bazei de cunoștințe, introduceți o descriere opțională, cum ar fi Baza de cunoștințe pentru asimilarea și stocarea datelor imdb.
- Pentru Permisiuni IAM, Selectați Creați și utilizați un nou rol de serviciu, apoi introduceți un nume pentru noul rol de serviciu.
- Alege Pagina Următoare →.
- Pentru Numele sursei de date, introduce
imdb-s3
. - Pentru S3 URI, introduceți URI-ul S3 în care ați încărcat datele.
- În Setări avansate – opțional secțiune, pt Strategia de fragmentare, alege Fără fragmentare.
- Alege Pagina Următoare →.
Bazele de cunoștințe vă permit să vă împărțiți documentele în segmente mai mici pentru a vă facilita procesarea documentelor mari. În cazul nostru, am împărțit deja datele într-un document de dimensiune mai mică (unul pentru fiecare film).
- În Baza de date vectorială secțiune, selectați Creați rapid un nou magazin de vectori.
Amazon Bedrock va crea automat o colecție de căutare vectorială OpenSearch Serverless complet gestionată și va configura setările pentru încorporarea surselor de date folosind modelul de încorporare de text Titan Embedding G1 ales.
- Alege Pagina Următoare →.
- Examinați setările și alegeți Creați o bază de cunoștințe.
Sincronizați-vă datele cu baza de cunoștințe
Acum că v-ați creat baza de cunoștințe, puteți sincroniza baza de cunoștințe cu datele dvs.
- Pe consola Amazon Bedrock, navigați la baza dvs. de cunoștințe.
- În Sursă de date secțiune, pentru a alege Sincronizați.
După ce sursa de date este sincronizată, sunteți gata să interogați datele.
Îmbunătățiți căutarea folosind rezultate semantice
Parcurgeți următorii pași pentru a testa soluția și pentru a vă îmbunătăți căutarea folosind rezultate semantice:
- Pe consola Amazon Bedrock, navigați la baza dvs. de cunoștințe.
- Selectați baza de cunoștințe și alegeți Testați baza de cunoștințe.
- Alege Selectați modelulși alegeți Claude antropic v2.1.
- Alege Aplică.
Acum sunteți gata să interogați datele.
Putem pune câteva întrebări semantice, cum ar fi „Recomandă-mi câteva filme cu tematică de Crăciun”.
Răspunsurile din baza de cunoștințe conțin citate pe care le puteți explora pentru corectitudinea răspunsurilor și fapte.
De asemenea, puteți detalia orice informații de care aveți nevoie din aceste filme. În exemplul următor, întrebăm „cine a regizat coșmar înainte de Crăciun?”
De asemenea, puteți pune întrebări mai specifice legate de genuri și evaluări, cum ar fi „Arată-mi filme animate clasice cu evaluări mai mari de 7?”
Măriți-vă baza de cunoștințe cu agenți
Agenți pentru Amazon Bedrock vă ajută să automatizați sarcini complexe. Agenții pot împărți interogarea utilizatorului în sarcini mai mici și pot apela API-uri personalizate sau baze de cunoștințe pentru a suplimenta informațiile pentru executarea acțiunilor. Cu Agents for Amazon Bedrock, dezvoltatorii pot integra agenți inteligenți în aplicațiile lor, accelerând livrarea aplicațiilor bazate pe inteligență artificială și economisind săptămâni de timp de dezvoltare. Cu agenți, vă puteți spori baza de cunoștințe adăugând mai multe funcționalități, cum ar fi recomandări de la Personalizați Amazon pentru recomandări specifice utilizatorului sau efectuarea de acțiuni, cum ar fi filtrarea filmelor în funcție de nevoile utilizatorului.
Concluzie
În această postare, am arătat cum să construiți un chatbot de film conversațional folosind Amazon Bedrock în câțiva pași pentru a răspunde experiențelor de căutare semantică și conversaționale bazate pe propriile date și pe setul de date cu licență IMDb și Box Office Mojo Movies/TV/OTT. În următoarea postare, trecem prin procesul de adăugare a mai multor funcționalități la soluția dvs. folosind agenți pentru Amazon Bedrock. Pentru a începe cu bazele de cunoștințe pe Amazon Bedrock, consultați Baze de cunoștințe pentru Amazon Bedrock.
Despre Autori
Gaurav Rele este Senior Data Scientist la Centrul de Inovare Generative AI, unde lucrează cu clienții AWS din diferite verticale pentru a accelera utilizarea lor a serviciilor generative AI și AWS Cloud pentru a-și rezolva provocările de afaceri.
Divya Bhargavi este Senior Applied Scientist Lead la Generative AI Innovation Center, unde rezolvă probleme de afaceri de mare valoare pentru clienții AWS folosind metode generative AI. Lucrează la înțelegerea și regăsirea imaginilor/video, modelelor de limbaj mari cu grafic de cunoștințe augmentate și cazuri de utilizare a reclamelor personalizate.
Suren Gunturu este un Data Scientist care lucrează în Centrul de inovare Generative AI, unde lucrează cu diverși clienți AWS pentru a rezolva probleme de afaceri de mare valoare. El este specializat în construirea conductelor ML folosind modele de limbaj mari, în primul rând prin Amazon Bedrock și alte servicii AWS Cloud.
Vidya Sagar Ravipati este manager științific la Generative AI Innovation Center, unde își valorifică vasta experiență în sistemele distribuite la scară largă și pasiunea pentru învățarea automată pentru a ajuta clienții AWS din diferite verticale din industrie să-și accelereze adoptarea AI și a cloud-ului.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :are
- :este
- :Unde
- $ 10 de milioane de
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- Despre Noi
- accelera
- accelerarea
- acces
- precis
- peste
- acțiuni
- actori
- adăugare
- Suplimentar
- Adoptare
- Promovare
- agenţi
- AI
- AI-alimentat
- TOATE
- permite
- singur
- deja
- de asemenea
- Amazon
- Amazon Web Services
- an
- și
- răspunde
- răspunsuri
- Orice
- API-uri
- aplicatii
- aplicat
- Apps
- SUNT
- AS
- cere
- At
- spori
- augmented
- automatizarea
- în mod automat
- AWS
- de bază
- bazat
- BE
- înainte
- Miliard
- Cutie
- box office
- Pauză
- construi
- Clădire
- afaceri
- by
- apel
- denumit
- CAN
- capacitate
- captura
- capturarea
- caz
- cazuri
- catalog
- Centru
- provocări
- chatbot
- Alege
- ales
- Crăciunul
- clasic
- Cloud
- adoptarea norului
- servicii de tip cloud
- cod
- colectare
- combinând
- comercial
- companie
- complex
- Consoleze
- conţine
- conţinut
- context
- contextual
- de conversaţie
- conversații
- corecta
- țări
- Cuplu
- crea
- a creat
- credite
- echipaj
- critic
- personalizat
- client
- Angajarea cu clienții
- clienţii care
- personaliza
- de date
- Schimb de date
- om de știință de date
- Data
- livra
- livrare
- descriere
- detalii
- Dezvoltatorii
- Dezvoltare
- diferit
- dirijat
- Director
- Directorii
- descoperi
- descoperire
- distribuite
- sisteme distribuite
- document
- documente
- jos
- conduce
- eliminarea
- Încorporarea
- permite
- un capăt la altul
- angajament
- îmbogățitor
- Intrați
- Divertisment
- Eter (ETH)
- Fiecare
- exemplu
- schimb
- experienţă
- Experiențe
- explora
- puțini
- Fișier
- Fişiere
- filtrare
- Găsi
- descoperire
- urma
- următor
- Pentru
- format
- din
- complet
- funcționalitate
- g1
- genera
- generaţie
- generativ
- AI generativă
- Genuri
- obține
- Caritate
- Go
- grafic
- mai mare
- Avea
- he
- ajutor
- la nivel înalt
- lui
- Cum
- Cum Pentru a
- Totuși
- HTML
- http
- HTTPS
- if
- Punere în aplicare a
- îmbunătăţi
- in
- Inclusiv
- Crește
- industrie
- info
- informații
- Inovaţie
- întreba
- integra
- Inteligent
- scop
- în
- implică
- IT
- jpg
- doar
- cunoştinţe
- lipsă
- limbă
- mare
- pe scară largă
- conduce
- conducere
- învăţare
- pîrghii
- Licență
- Autorizat
- de licențiere
- ca
- LLM
- local
- locaţie
- LOWER
- maşină
- masina de învățare
- face
- administra
- gestionate
- manager
- multe
- me
- Mass-media
- Membri actuali
- Metadata
- Metode
- milion
- ML
- model
- Modele
- Mojo
- mai mult
- film
- Filme
- nume
- nume
- Navigaţi
- Navigare
- Nevoie
- nevoilor
- Nou
- următor
- noapte
- of
- Birou
- on
- ONE
- Oportunitate
- or
- organizații
- Altele
- al nostru
- peste
- propriu
- pachet
- pagină
- plătit
- pâine
- parte
- pasiune
- cale
- pentru
- efectuarea
- Personalizat
- Platforme
- Plato
- Informații despre date Platon
- PlatoData
- intrigă
- Popular
- Post
- poster
- în primul rând
- probleme
- proces
- producător
- Producătorii
- proprietate
- furnizează
- interogări
- întrebare
- Întrebări
- cârpă
- gamă
- tarife
- evaluare
- evaluări
- gata
- recomanda
- Recomandare
- Recomandări
- record
- trimite
- legate de
- Raportarea
- Necesită
- răspuns
- răspunsuri
- REZULTATE
- retenţie
- regăsire
- reveni
- Rol
- RÂND
- funcţionare
- satisfacție
- economisire
- Ştiinţă
- Om de stiinta
- Caută
- Secțiune
- în siguranță,
- segmente
- selecta
- semantică
- semantică
- senior
- serverless
- serviciu
- Servicii
- setări
- ea
- shot
- Arăta
- prezenta
- a arătat
- simplu
- simula
- singur
- Mărimea
- mai mici
- So
- soluţie
- REZOLVAREA
- rezolvă
- unele
- Sursă
- Surse
- specializată
- specific
- început
- paşi
- depozitare
- stoca
- stocate
- simplu
- abonament
- astfel de
- completa
- sincronizare
- sisteme
- Lua
- sarcini
- tehnică
- test
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- decât
- acea
- informațiile
- lor
- Lor
- tematic
- apoi
- Acolo.
- Acestea
- ei
- acest
- Prin
- timp
- gigant
- titluri
- la
- tv
- înţelegere
- înțeles
- nestructurat
- up-to-data
- încărcat
- URI
- URL-ul
- utilizare
- utilizat
- Utilizator
- utilizatorii
- folosind
- diverse
- Fixă
- verticalele
- Vizita
- W
- umbla
- vrea
- a fost
- we
- web
- servicii web
- săptămâni
- larg
- Gamă largă
- voi
- cu
- flux de lucru
- de lucru
- fabrică
- scrie
- X
- an
- tu
- Ta
- zephyrnet