Käyttäjien uuden sisällön löytämisen parantaminen on ratkaisevan tärkeää käyttäjien sitoutumisen ja tyytyväisyyden lisäämiseksi mediaalustoilla. Pelkästään avainsanahaulla on haasteita semantiikan ja käyttäjien aikomusten vangitsemisessa, mikä johtaa tuloksiin, joista puuttuu relevantti konteksti. esimerkiksi treffi-illan tai jouluaiheisten elokuvien löytäminen. Tämä voi alentaa säilytysprosentteja, jos käyttäjät eivät löydä haluamaansa sisältöä luotettavasti. Kuitenkin kanssa suuria kielimalleja (LLM:t), on mahdollisuus ratkaista nämä semanttiset ja käyttäjätarkoitushaasteet. Yhdistämällä upotukset jotka vangitsevat semantiikan tekniikalla nimeltä Retrieval Augmented Generation (RAG), voit luoda osuvampia vastauksia omista tietolähteistäsi haetun kontekstin perusteella.
Tässä viestissä näytämme, kuinka voit turvallisesti luoda elokuvan chatbotin ottamalla käyttöön RAG:n omilla tiedoillasi Tietokannat varten Amazonin kallioperä. Käytämme IMDb- ja Box Office Mojo -tietosarjaa simuloidaksemme media- ja viihdeasiakkaiden luetteloa ja esitellä, kuinka voit rakentaa oman RAG-ratkaisusi muutamassa vaiheessa.
Ratkaisun yleiskatsaus
- IMDb ja Box Office Mojo Movies/TV/OTT lisensoitava tietopaketti tarjoaa laajan valikoiman viihteen metatietoja, mukaan lukien yli miljardi käyttäjäarviota; hyvitykset yli 1.6 miljoonalle näyttelijälle ja miehistön jäsenelle; 13 miljoonaa elokuva-, TV- ja viihdenimikettä; ja maailmanlaajuiset lipputulojen raportointitiedot yli 10 maasta. Monet AWS-media- ja viihdeasiakkaat lisensoivat IMDb-tietoja AWS-tiedonvaihto parantaa sisällön löytämistä ja lisätä asiakkaiden sitoutumista ja säilyttämistä.
Johdatus Amazon Bedrockin tietokantoihin
Organisaatiot käyttävät LLM:n varustamiseksi ajantasaisilla omistusoikeudellisilla tiedoilla RAG:ta, tekniikkaa, joka sisältää tietojen hakemisen yrityksen tietolähteistä ja kehotteen rikastamisen kyseisillä tiedoilla, jotta saadaan osuvampia ja tarkempia vastauksia. Amazon Bedrockin tietokannat mahdollistavat täysin hallitun RAG-ominaisuuden, jonka avulla voit mukauttaa LLM-vastauksia kontekstuaalisten ja asiaankuuluvien yritystietojen avulla. Knowledge Bases automatisoi päästä päähän RAG-työnkulun, mukaan lukien tiedonkeruun, haun, lisäyksen ja lainaukset, jolloin sinun ei tarvitse kirjoittaa mukautettua koodia tietolähteiden integroimiseksi ja kyselyjen hallintaan. Amazon Bedrockin tietokannat mahdollistavat myös monikäännökset keskustelut, jotta LLM voi vastata monimutkaisiin käyttäjien kyselyihin oikealla vastauksella.
Käytämme seuraavia palveluita osana tätä ratkaisua:
Käymme läpi seuraavat korkean tason vaiheet:
- Esikäsittele IMDb-tiedot luodaksesi asiakirjoja jokaisesta elokuvatietueesta ja lataa tiedot tiedostoon Amazonin yksinkertainen tallennuspalvelu (Amazon S3)-kauha.
- Luo tietopohja.
- Synkronoi tietokantasi tietolähteesi kanssa.
- Käytä tietokantaa vastataksesi elokuvaluetteloa koskeviin semanttisiin kyselyihin.
Edellytykset
Tässä viestissä käytetyt IMDb-tiedot vaativat kaupallisen sisällön lisenssin ja maksullisen IMDb-tilauksen ja Box Office Mojo Movies/TV/OTT-lisenssipaketin AWS Data Exchangessa. Voit tiedustella lisenssiä ja käyttää näytetietoja osoitteessa developer.imdb.com. Jos haluat käyttää tietojoukkoa, katso Tehosuositus ja haku IMDb-tietokaavion avulla – Osa 1 ja seuraa Käytä IMDb-tietoja osiossa.
Esikäsittele IMDb-tiedot
Ennen kuin luomme tietokannan, meidän on esikäsiteltävä IMDb-tietojoukko tekstitiedostoiksi ja ladattava ne S3-ämpäriin. Tässä viestissä simuloimme asiakasluetteloa IMDb-tietojoukon avulla. Otamme 10,000 XNUMX suosittua elokuvaa IMDb-tietojoukosta luetteloa varten ja rakennamme tietojoukon.
Käytä seuraavaa muistikirja luodaksesi tietojoukon lisätiedoilla, kuten näyttelijöiden, ohjaajien ja tuottajien nimet. Käytämme seuraavaa koodia luodaksemme elokuvalle yhden tiedoston, jossa on kaikki tiedostoon tallennetut tiedot jäsentämättömänä tekstinä, jota LLM:t voivat ymmärtää:
Kun sinulla on tiedot .txt-muodossa, voit ladata tiedot Amazon S3:een käyttämällä seuraavaa komentoa:
Luo IMDb-tietokanta
Luo tietopohjasi suorittamalla seuraavat vaiheet:
- Valitse Amazon Bedrock -konsolista Tietoa navigointipaneelissa.
- Valita Luo tietopohja.
- varten Tietopohjan nimi, tulla sisään
imdb
. - varten Tietopohjan kuvaus, anna valinnainen kuvaus, kuten tietokanta imdb-tietojen käsittelyä ja tallentamista varten.
- varten IAM-oikeudetvalitse Luo uusi palvelurooli ja käytä sitäja anna sitten nimi uudelle palveluroolillesi.
- Valita seuraava.
- varten Tietolähteen nimi, tulla sisään
imdb-s3
. - varten S3 URI, anna S3 URI, johon lähetit tiedot.
- In Lisäasetukset – valinnainen osa, varten Purkamisstrategia, valitse Ei nykimistä.
- Valita seuraava.
Tietokannan avulla voit ryhmitellä asiakirjasi pienempiin osiin, jotta suurten asiakirjojen käsittely on helppoa. Meidän tapauksessamme olemme jo lohkoneet tiedot pienemmäksi asiakirjaksi (yksi per elokuva).
- In Vektoritietokanta , valitse Luo nopeasti uusi vektorikauppa.
Amazon Bedrock luo automaattisesti täysin hallitun OpenSearch-palvelimettoman vektorihakukokoelman ja määrittää tietolähteesi upottamisen asetukset käyttämällä valittua Titan Embedding G1 – Tekstin upotusmallia.
- Valita seuraava.
- Tarkista asetukset ja valitse Luo tietopohja.
Synkronoi tietosi tietokannan kanssa
Nyt kun olet luonut tietokannan, voit synkronoida tietokannan tietojesi kanssa.
- Siirry tietokantaasi Amazon Bedrock -konsolissa.
- In Tietolähde osiossa, valitse Synkronoi.
Kun tietolähde on synkronoitu, olet valmis tiedustelemaan tietoja.
Paranna hakua semanttisten tulosten avulla
Suorita seuraavat vaiheet testataksesi ratkaisua ja parantaaksesi hakuasi semanttisten tulosten avulla:
- Siirry tietokantaasi Amazon Bedrock -konsolissa.
- Valitse tietopohjasi ja valitse Testaa tietopohjaa.
- Valita Valitse malli, ja valitse Antrooppinen Claude v2.1.
- Valita käyttää.
Nyt olet valmis tiedustelemaan tietoja.
Voimme kysyä joitain semanttisia kysymyksiä, kuten "Suosittele minulle jouluaiheisia elokuvia".
Tietopohjan vastaukset sisältävät viittauksia, joista voit tutkia vastausten oikeellisuutta ja tosiseikkaa.
Voit myös kartoittaa mitä tahansa tarvitsemaasi tietoa näistä elokuvista. Seuraavassa esimerkissä kysymme "kuka ohjasi painajaisen ennen joulua?"
Voit myös kysyä tarkempia genreihin ja luokitukseen liittyviä kysymyksiä, kuten "näytä minulle klassisia animaatioelokuvia, joiden luokitus on yli 7?"
Laajenna tietopohjaasi agenttien avulla
Amazon Bedrockin edustajat auttaa automatisoimaan monimutkaisia tehtäviä. Agentit voivat jakaa käyttäjän kyselyn pienempiin tehtäviin ja kutsua mukautettuja sovellusliittymiä tai tietokantoja täydentämään tietoja suoritettavia toimintoja varten. Agents for Amazon Bedrockin avulla kehittäjät voivat integroida älykkäitä agentteja sovelluksiinsa, mikä nopeuttaa tekoälypohjaisten sovellusten toimitusta ja säästää viikkoja kehitysaikaa. Agenttien avulla voit laajentaa tietopohjaasi lisäämällä toimintoja, kuten suosituksia Amazon Muokkaa käyttäjäkohtaisiin suosituksiin tai toimiin, kuten elokuvien suodattamiseen käyttäjien tarpeiden mukaan.
Yhteenveto
Tässä viestissä näytimme, kuinka voit rakentaa keskusteluelokuvachatbotin Amazon Bedrockin avulla muutamassa vaiheessa vastaamaan semanttiseen haku- ja keskustelukokemukseen omien tietojesi sekä IMDb- ja Box Office Mojo Movies/TV/OTT -lisensoitujen tietojoukon perusteella. Seuraavassa postauksessa käymme läpi prosessin, jolla ratkaisuasi lisätään toimintoja Agents for Amazon Bedrockin avulla. Aloita Amazon Bedrockin tietokantojen käyttö kohdasta Amazon Bedrockin tietokannat.
Tietoja Tekijät
Gaurav Rele on vanhempi datatieteilijä Generative AI Innovation Centerissä, jossa hän työskentelee AWS-asiakkaiden kanssa eri toimialoilla nopeuttaakseen heidän generatiivisten tekoäly- ja AWS-pilvipalveluiden käyttöä liiketoimintahaasteiden ratkaisemiseksi.
Divya Bhargavi on vanhempi soveltuva tutkija Generative AI Innovation Centerissä, jossa hän ratkaisee AWS-asiakkaiden arvokkaita liiketoimintaongelmia generatiivisilla tekoälymenetelmillä. Hän työskentelee kuvien/videoiden ymmärtämisen ja haun parissa, tietokaavioita täydentävien suurten kielimallien parissa ja personoitujen mainonnan käyttötapausten parissa.
Suren Gunturu on Data Scientist, joka työskentelee Generative AI Innovation Centerissä, jossa hän työskentelee useiden AWS-asiakkaiden kanssa ratkaistakseen arvokkaita liiketoimintaongelmia. Hän on erikoistunut ML-putkien rakentamiseen Large Language Models -malleilla, pääasiassa Amazon Bedrockin ja muiden AWS-pilvipalveluiden kautta.
Vidya Sagar Ravipati on tiedepäällikkö Generative AI Innovation Centerissä, jossa hän hyödyntää laajaa kokemustaan laajamittaisista hajautetuista järjestelmistä ja intohimoaan koneoppimiseen auttaakseen AWS-asiakkaita eri toimialoilla nopeuttamaan tekoälyn ja pilven käyttöönottoa.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :on
- :On
- :missä
- $ 10 euroa
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- Meistä
- kiihdyttää
- kiihtyvä
- pääsy
- tarkka
- poikki
- toimet
- toimijoiden
- lisää
- lisä-
- Hyväksyminen
- mainonta
- aineet
- AI
- AI-käyttöinen
- Kaikki
- mahdollistaa
- yksin
- jo
- Myös
- Amazon
- Amazon Web Services
- an
- ja
- vastaus
- vastauksia
- Kaikki
- API
- sovellukset
- sovellettu
- sovellukset
- OVAT
- AS
- kysyä
- At
- lisätä
- täydennetty
- automatisoida
- automaattisesti
- AWS
- pohja
- perustua
- BE
- ennen
- Miljardi
- Laatikko
- lippumyymälä
- Tauko
- rakentaa
- Rakentaminen
- liiketoiminta
- by
- soittaa
- nimeltään
- CAN
- valmiudet
- kaapata
- Kaappaaminen
- tapaus
- tapauksissa
- luettelo
- keskus
- haasteet
- chatbot
- Valita
- valittu
- Joulu
- klassinen
- pilvi
- pilvien hyväksyminen
- pilvipalvelut
- koodi
- kokoelma
- yhdistely
- kaupallinen
- yritys
- monimutkainen
- Console
- sisältää
- pitoisuus
- tausta
- asiayhteyteen
- puhekielen
- keskustelut
- korjata
- maahan
- Pari
- luoda
- luotu
- Laajuus
- miehistö
- kriittinen
- asiakassuhde
- asiakas
- Asiakkaan sitoutuminen
- Asiakkaat
- räätälöidä
- tiedot
- Tiedonvaihto
- tietojen tutkija
- Päivämäärä
- toimittaa
- toimitus
- kuvaus
- yksityiskohdat
- kehittäjille
- Kehitys
- eri
- suunnattu
- Johtaja
- Ohjaajat
- löytää
- löytö
- jaettu
- hajautetut järjestelmät
- asiakirja
- asiakirjat
- alas
- ajaa
- poistamalla
- upottamisen
- mahdollistaa
- päittäin
- sitoumus
- rikastuttava
- enter
- Viihde
- Eetteri (ETH)
- Joka
- esimerkki
- Vaihdetaan
- experience
- Elämykset
- tutkia
- harvat
- filee
- Asiakirjat
- suodatus
- Löytää
- löytäminen
- seurata
- jälkeen
- varten
- muoto
- alkaen
- täysin
- toiminnallisuus
- g1
- tuottaa
- sukupolvi
- generatiivinen
- Generatiivinen AI
- tyylilajit
- saada
- Global
- Go
- kaavio
- suurempi
- Olla
- he
- auttaa
- korkean tason
- hänen
- Miten
- Miten
- Kuitenkin
- HTML
- http
- HTTPS
- if
- täytäntöönpanosta
- parantaa
- in
- Mukaan lukien
- Kasvaa
- teollisuus
- tiedot
- tiedot
- Innovaatio
- tiedustella
- yhdistää
- Älykäs
- tahallisuus
- tulee
- liittyy
- IT
- jpg
- vain
- tuntemus
- Lack
- Kieli
- suuri
- laaja
- johtaa
- johtava
- oppiminen
- vipusuhteita
- Lisenssi
- Licensed
- Licensing
- pitää
- llm
- paikallinen
- sijainti
- alentaa
- kone
- koneoppiminen
- tehdä
- hoitaa
- onnistui
- johtaja
- monet
- me
- Media
- Jäsenet
- Metadata
- menetelmät
- miljoona
- ML
- malli
- mallit
- Mojo
- lisää
- elokuva
- Elokuvat
- nimi
- nimet
- Navigoida
- suunnistus
- Tarve
- tarpeet
- Uusi
- seuraava
- yön
- of
- Office
- on
- ONE
- Tilaisuus
- or
- organisaatioiden
- Muut
- meidän
- yli
- oma
- paketti
- sivulla
- maksettu
- lasi
- osa
- intohimo
- polku
- varten
- esittävä
- yksilöllinen
- Platforms
- Platon
- Platonin tietotieto
- PlatonData
- juoni
- Suosittu
- Kirje
- juliste
- pääasiallisesti
- ongelmia
- prosessi
- tuottaja
- tuottajat
- patentoitu
- tarjoaa
- kyselyt
- kysymys
- kysymykset
- rätti
- alue
- Hinnat
- luokitus
- arviot
- valmis
- suositella
- Suositus
- suosituksia
- ennätys
- katso
- liittyvä
- merkityksellinen
- Raportointi
- Vaatii
- vastaus
- vasteet
- tulokset
- säilyttäminen
- haku
- palata
- Rooli
- RIVI
- juoksu
- tyytyväisyys
- tallentaa
- tiede
- Tiedemies
- Haku
- Osa
- turvallisesti
- segmentit
- valita
- semanttinen
- semantiikka
- vanhempi
- serverless
- palvelu
- Palvelut
- settings
- hän
- laukaus
- näyttää
- näyteikkuna
- osoittivat
- Yksinkertainen
- simuloida
- single
- Koko
- pienempiä
- So
- ratkaisu
- SOLVE
- Ratkaisee
- jonkin verran
- lähde
- Lähteet
- erikoistunut
- erityinen
- alkoi
- Askeleet
- Levytila
- verkkokaupasta
- tallennettu
- suora
- tilaus
- niin
- täydentää
- synkronointi.
- järjestelmät
- ottaa
- tehtävät
- tekniikka
- testi
- teksti
- kuin
- että
- -
- tiedot
- heidän
- Niitä
- teemalla
- sitten
- Siellä.
- Nämä
- ne
- tätä
- Kautta
- aika
- Titaani
- otsikot
- että
- tv
- ymmärtäminen
- ymmärsi
- jäsentymätön
- ajanmukainen
- ladattu
- URI
- URL
- käyttää
- käytetty
- käyttäjä
- Käyttäjät
- käyttämällä
- eri
- valtava
- pystysuunnassa
- Vierailla
- W
- kävellä
- haluta
- oli
- we
- verkko
- verkkopalvelut
- viikkoa
- leveä
- Laaja valikoima
- tulee
- with
- työnkulku
- työskentely
- toimii
- kirjoittaa
- X
- vuosi
- te
- Sinun
- zephyrnet