Kasutajate seotuse ja rahulolu suurendamiseks meediaplatvormidel on oluline parandada seda, kuidas kasutajad avastavad uut sisu. Ainuüksi märksõnaotsingul on väljakutseid semantika ja kasutaja kavatsuste tabamisel, mis viib tulemusteni, millel puudub asjakohane kontekst; näiteks kohtinguõhtu või jõuluteemaliste filmide leidmine. See võib vähendada säilitamismäära, kui kasutajad ei leia soovitud sisu usaldusväärselt. Siiski koos suured keelemudelid (LLM-id), on võimalus need semantilised ja kasutaja kavatsuslikud väljakutsed lahendada. Kombineerides manused mis püüavad semantika tehnikaga nimega Retrieval Augmented Generation (RAG), saate luua asjakohasemaid vastuseid oma andmeallikatest hangitud konteksti põhjal.
Selles postituses näitame teile, kuidas luua turvaliselt filmivestlusbot, rakendades RAG-i oma andmetega Teadmusbaasid eest Amazonase aluspõhi. Kasutame IMDb ja Box Office Mojo andmekogumit, et simuleerida kataloogi meedia- ja meelelahutusklientidele ning näidata, kuidas saate mõne sammuga luua oma RAG-lahenduse.
Lahenduse ülevaade
. IMDb ja Box Office Mojo Movies/TV/OTT litsentseeritav andmepakett pakub laias valikus meelelahutuse metaandmeid, sealhulgas üle 1.6 miljardi kasutaja hinnangu; krediiti enam kui 13 miljonile näitleja- ja meeskonnaliikmele; 10 miljonit filmi, telesaadet ja meelelahutust; ja ülemaailmsed kassaaruannete andmed enam kui 60 riigist. Paljud AWS-i meedia- ja meelelahutuskliendid litsentseerivad IMDb-andmeid selle kaudu AWS-i andmevahetus parandada sisu avastamist ning suurendada klientide seotust ja hoidmist.
Sissejuhatus Amazoni aluspõhja teadmistebaasi
LLM-i varustamiseks ajakohase patenteeritud teabega kasutavad organisatsioonid RAG-i, tehnikat, mis hõlmab andmete toomist ettevõtte andmeallikatest ja viipa rikastamist nende andmetega, et pakkuda asjakohasemaid ja täpsemaid vastuseid. Amazon Bedrocki teadmistebaasid võimaldavad täielikult hallatavat RAG-i võimalust, mis võimaldab teil kohandada LLM-i vastuseid kontekstipõhiste ja asjakohaste ettevõtteandmetega. Teabebaasid automatiseerivad täieliku RAG-i töövoogu, sealhulgas allaneelamist, otsimist, kiiret suurendamist ja tsiteerimist, välistades vajaduse andmeallikate integreerimiseks ja päringute haldamiseks kohandatud koodi kirjutamise järele. Amazon Bedrocki teadmistebaasid võimaldavad ka mitme pöördega vestlusi, et LLM saaks vastata keerulistele kasutajapäringutele õige vastusega.
Selle lahenduse osana kasutame järgmisi teenuseid:
Läbime järgmised kõrgetasemelised sammud:
- Eeltöötlege IMDb andmeid, et luua dokumente igast filmikirjest ja laadida andmed üles Amazoni lihtne salvestusteenus (Amazon S3) kopp.
- Loo teadmistebaas.
- Sünkroonige oma teadmistebaas andmeallikaga.
- Kasutage teadmistebaasi, et vastata filmikataloogi puudutavatele semantilistele päringutele.
Eeldused
Selles postituses kasutatavad IMDb-andmed nõuavad kommertssisu litsentsi ja tasulist IMDb ja Box Office Mojo Moviesi/TV/OTT-litsentsipaketi tellimust AWS-i andmevahetuses. Litsentsi kohta teabe saamiseks ja näidisandmetele juurdepääsu saamiseks külastage veebisaiti developer.imdb.com. Andmestikule juurdepääsu saamiseks vaadake Võimsussoovitus ja otsing IMDb teadmiste graafiku abil – 1. osa ja järgige Juurdepääs IMDb andmetele sektsiooni.
Eeltöötlege IMDb andmeid
Enne teadmistebaasi loomist peame IMDb-andmestiku eeltöötlema tekstifailideks ja laadima need S3 ämbrisse. Selles postituses simuleerime kliendikataloogi, kasutades IMDb andmestikku. Võtame kataloogi jaoks IMDb-andmestikust 10,000 XNUMX populaarset filmi ja koostame andmekogumi.
Kasutage järgmist märkmik andmestiku loomiseks lisateabega, nagu näitlejad, režissöörid ja tootjate nimed. Kasutame järgmist koodi, et luua filmi jaoks üks fail, mis sisaldab kogu faili salvestatud teavet struktureerimata tekstina, mida LLM-id mõistavad:
Kui teil on andmed .txt-vormingus, saate need Amazon S3-sse üles laadida, kasutades järgmist käsku:
Looge IMDb teadmistebaas
Oma teadmistebaasi loomiseks tehke järgmised sammud.
- Amazon Bedrocki konsoolil valige Teadmistepagas navigeerimispaanil.
- Vali Loo teadmistebaas.
- eest Teadmiste baasi nimi, sisenema
imdb
. - eest Teadmusbaasi kirjeldus, sisestage valikuline kirjeldus, näiteks teabebaas imdb-andmete allaneelamiseks ja salvestamiseks.
- eest IAM-i loadvalige Looge ja kasutage uut teenindusrolli, seejärel sisestage oma uue teenuserolli nimi.
- Vali järgmine.
- eest Andmeallika nimi, sisenema
imdb-s3
. - eest S3 URI, sisestage S3 URI, kuhu andmed üles laadisite.
- aasta Täpsemad seaded – valikuline jaotis, jaoks Tükeldamise strateegia, vali Ei mingit tükkimist.
- Vali järgmine.
Teabebaasid võimaldavad teil dokumente tükeldada väiksemateks segmentideks, et suurte dokumentide töötlemine oleks lihtne. Meie puhul oleme andmed juba tükeldanud väiksemaks dokumendiks (üks filmi kohta).
- aasta Vektori andmebaas jaotises valige Looge kiiresti uus vektorpood.
Amazon Bedrock loob automaatselt täielikult hallatava OpenSearchi serverita vektorotsingu kogu ja konfigureerib teie andmeallikate manustamise seaded, kasutades valitud Titan Embedding G1 – teksti manustamise mudelit.
- Vali järgmine.
- Vaadake oma seaded üle ja valige Loo teadmistebaas.
Sünkroonige oma andmed teadmistebaasiga
Nüüd, kui olete oma teadmistebaasi loonud, saate teadmistebaasi oma andmetega sünkroonida.
- Navigeerige Amazon Bedrocki konsoolis oma teadmistebaasi.
- aasta Andmeallikas Valige jaotises Sync.
Pärast andmeallika sünkroonimist olete valmis andmete päringuid tegema.
Täiustage otsingut semantiliste tulemuste abil
Lahenduse testimiseks ja otsingu täiustamiseks semantiliste tulemuste abil tehke järgmist.
- Navigeerige Amazon Bedrocki konsoolis oma teadmistebaasi.
- Valige oma teadmistebaas ja valige Testi teadmistebaasi.
- Vali Valige mudelja vali Antroopiline Claude v2.1.
- Vali kehtima.
Nüüd olete valmis andmete päringuid tegema.
Võime esitada mõningaid semantilisi küsimusi, näiteks „Soovitage mulle mõnda jõuluteemalist filmi”.
Teadmusbaasi vastused sisaldavad tsitaate, mille abil saate uurida vastuste õigsust ja faktilisust.
Samuti saate nendest filmidest vajaliku teabe põhjalikumalt uurida. Järgmises näites küsime: "Kes lavastas õudusunenägu enne jõule?"
Samuti saate esitada žanrite ja reitingute kohta täpsemaid küsimusi, näiteks "näita mulle klassikalisi animafilme, mille reitingud on üle 7?"
Täiendage oma teadmistebaasi agentidega
Amazon Bedrocki agendid aitab automatiseerida keerulisi ülesandeid. Agendid saavad jagada kasutajapäringu väiksemateks ülesanneteks ja kutsuda kohandatud API-sid või teadmistebaase, et täiendada teavet toimingute tegemiseks. Rakenduse Agents for Amazon Bedrock abil saavad arendajad integreerida oma rakendustesse intelligentseid agente, kiirendades tehisintellektil töötavate rakenduste tarnimist ja säästes nädalaid arendusaega. Agentide abil saate oma teadmistebaasi täiendada, lisades rohkem funktsioone, näiteks soovitusi Isikupärastage Amazon kasutajapõhiste soovituste jaoks või toimingute tegemiseks, nagu filmide filtreerimine kasutaja vajaduste alusel.
Järeldus
Selles postituses näitasime, kuidas luua mõne sammuga Amazon Bedrocki abil vestlusfilmide vestlusrobot, et vastata semantilisele otsingule ja vestluskogemustele teie enda andmete ning IMDb ja Box Office Mojo Movies/TV/OTT litsentsitud andmestiku põhjal. Järgmises postituses käsitleme teie lahendusele lisafunktsioonide lisamise protsessi, kasutades Agents for Amazon Bedrocki. Amazon Bedrocki teadmistebaasidega alustamiseks vaadake Amazon Bedrocki teadmistebaasid.
Autoritest
Gaurav Rele on vanemteadur Generative AI Innovation Centeris, kus ta teeb koostööd AWS-i klientidega erinevates vertikaalides, et kiirendada nende generatiivsete AI- ja AWS-i pilveteenuste kasutamist nende äriprobleemide lahendamiseks.
Divya Bhargavi on vanemrakendusteadlane Generative AI Innovation Centeris, kus ta lahendab generatiivsete AI meetodite abil väärtuslikke äriprobleeme AWS-i klientidele. Ta tegeleb piltide/videote mõistmise ja otsimise, teadmiste graafiku laiendatud suurte keelemudelite ja isikupärastatud reklaamide kasutusjuhtumitega.
Suren Gunturu on andmeteadlane, kes töötab generatiivses tehisintellekti innovatsioonikeskuses, kus teeb koostööd erinevate AWS-i klientidega, et lahendada väärtuslikke äriprobleeme. Ta on spetsialiseerunud ML-i torujuhtmete ehitamisele suurte keelemudelite abil, peamiselt Amazon Bedrocki ja muude AWS-i pilveteenuste kaudu.
Vidya Sagar Ravipati on Generative AI Innovation Centeri teadusjuht, kus ta kasutab oma tohutut kogemust suuremahuliste hajutatud süsteemide vallas ja kirge masinõppe vastu, et aidata AWS-i klientidel erinevates tööstusharudes kiirendada nende tehisintellekti ja pilve kasutuselevõttu.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :on
- :on
- : kus
- $ 10 miljonit
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- MEIST
- kiirendama
- kiirendades
- juurdepääs
- täpne
- üle
- meetmete
- osalejad
- lisades
- Täiendavad lisad
- Vastuvõtmine
- reklaam
- ained
- AI
- Tehisintellekti toega
- Materjal: BPA ja flataatide vaba plastik
- võimaldab
- üksi
- juba
- Ka
- Amazon
- Amazon Web Services
- an
- ja
- vastus
- vastuseid
- mistahes
- API-liidesed
- rakendused
- rakendatud
- apps
- OLEME
- AS
- küsima
- At
- suurendama
- suurendatud
- automatiseerima
- automaatselt
- AWS
- baas
- põhineb
- BE
- enne
- Miljard
- Kast
- piletikassa
- Murdma
- ehitama
- Ehitus
- äri
- by
- helistama
- kutsutud
- CAN
- võime
- lüüa
- Püüdmine
- juhul
- juhtudel
- kataloog
- keskus
- väljakutseid
- chatbot
- Vali
- valitud
- jõulud
- klassika
- Cloud
- pilve adopteerimine
- pilvteenustest
- kood
- kogumine
- kombineerimine
- kaubandus-
- ettevõte
- keeruline
- konsool
- sisaldama
- sisu
- kontekst
- kontekstuaalne
- jutukas
- vestlused
- parandada
- riikides
- Paar
- looma
- loodud
- Autorid
- meeskond
- kriitiline
- tava
- klient
- Kliendi kaasamine
- Kliendid
- kohandada
- andmed
- Andmevahetus
- andmeteadlane
- kuupäev
- tarnima
- tarne
- kirjeldus
- detailid
- Arendajad
- & Tarkvaraarendus
- erinev
- suunatud
- Juhataja
- Direktorid
- avastama
- avastus
- jagatud
- hajutatud süsteemid
- dokument
- dokumendid
- alla
- ajam
- kõrvaldades
- kinnistamine
- võimaldama
- Lõpuks-lõpuni
- tegevus
- rikastav
- sisene
- meelelahutus
- Eeter (ETH)
- Iga
- näide
- vahetamine
- kogemus
- Kogemused
- uurima
- vähe
- fail
- Faile
- filtreerimine
- leidma
- leidmine
- järgima
- Järel
- eest
- formaat
- Alates
- täielikult
- funktsionaalsus
- g1
- tekitama
- põlvkond
- generatiivne
- Generatiivne AI
- žanrid
- saama
- Globaalne
- Go
- graafik
- suurem
- Olema
- he
- aitama
- kõrgetasemeline
- tema
- Kuidas
- Kuidas
- aga
- HTML
- http
- HTTPS
- if
- rakendamisel
- parandama
- in
- Kaasa arvatud
- Suurendama
- tööstus
- info
- info
- Innovatsioon
- küsima
- integreerima
- Intelligentne
- tahtlus
- sisse
- hõlmab
- IT
- jpg
- lihtsalt
- teadmised
- puudus
- keel
- suur
- suuremahuline
- viima
- juhtivate
- õppimine
- võimendab
- litsents
- Litsentseeritud
- litsentsimine
- nagu
- llm
- kohalik
- liising
- vähendada
- masin
- masinõpe
- tegema
- juhtima
- juhitud
- juht
- palju
- me
- Meedia
- liikmed
- Metaandmed
- meetodid
- miljon
- ML
- mudel
- mudelid
- Mojo
- rohkem
- film
- Filmid
- nimi
- nimed
- Navigate
- NAVIGATSIOON
- Vajadus
- vajadustele
- Uus
- järgmine
- öö
- of
- Office
- on
- ONE
- Võimalus
- or
- organisatsioonid
- Muu
- meie
- üle
- enda
- pakend
- lehekülg
- makstud
- pane
- osa
- kirg
- tee
- kohta
- esitades
- Isikliku
- Platvormid
- Platon
- Platoni andmete intelligentsus
- PlatoData
- süžee
- populaarne
- post
- plakat
- eelkõige
- probleeme
- protsess
- tootja
- Tootjad
- varaline
- annab
- päringud
- päringu
- Küsimused
- rag
- valik
- Rates
- hinnang
- hinnangust
- valmis
- soovitama
- Soovitus
- soovitused
- rekord
- viitama
- seotud
- asjakohane
- Aruandlus
- Vajab
- vastus
- vastuste
- Tulemused
- säilitamine
- otsing
- tagasipöördumine
- Roll
- ROW
- jooksmine
- rahulolu
- säästmine
- teadus
- teadlane
- Otsing
- Osa
- kindlalt
- segmendid
- valima
- semantiline
- semantika
- vanem
- Serverita
- teenus
- Teenused
- seaded
- ta
- lask
- näitama
- presentatsioon
- näitas
- lihtne
- simuleerima
- ühekordne
- SUURUS
- väiksem
- So
- lahendus
- LAHENDAGE
- Lahendab
- mõned
- allikas
- Allikad
- spetsialiseerunud
- konkreetse
- alustatud
- Sammud
- ladustamine
- salvestada
- ladustatud
- lihtne
- tellimine
- selline
- täiendamine
- sünkroonida.
- süsteemid
- Võtma
- ülesanded
- tehnika
- test
- tekst
- kui
- et
- .
- teave
- oma
- Neile
- Temaatiline
- SIIS
- Seal.
- Need
- nad
- see
- Läbi
- aeg
- Titan
- pealkirjad
- et
- tv
- mõistmine
- arusaadav
- struktureerimata
- ajakohane
- laetud
- URI
- URL
- kasutama
- Kasutatud
- Kasutaja
- Kasutajad
- kasutamine
- eri
- suur
- vertikaalid
- visiit
- W
- kõndima
- tahan
- oli
- we
- web
- veebiteenused
- nädalat
- lai
- Lai valik
- will
- koos
- töövoog
- töö
- töötab
- kirjutama
- X
- aasta
- sa
- Sinu
- sephyrnet