SmugMugs holdbare søkerørledninger for Amazon OpenSearch Service | Amazon Web Services

Publisert av Platon

Følgere: 0

SmugMug driver to veldig store online fotoplattformer, SmugMug og Flickr, som gjør det mulig for mer enn 100 millioner kunder å trygt lagre, søke, dele og selge titalls milliarder bilder. Kunder som lastet opp og søkte gjennom flere tiår med bilder bidro til å gjøre søk til kritisk infrastruktur, og har vokst jevnt siden SmugMug først ble brukt Amazon CloudSearch i 2012, etterfulgt av Amazon OpenSearch-tjeneste siden 2018, etter å ha nådd milliarder av dokumenter og terabyte med søkelagring.

Her deler Lee Shepherd, SmugMug Staff Engineer, SmugMugs søkearkitektur som brukes til å publisere, fylle ut og speile live trafikk til flere klynger. SmugMug bruker disse rørledningene til å benchmarke, validere og migrere til nye konfigurasjoner, inkludert Graviton-baserte r6gd.2xlarge-forekomster fra i3.2xlarge, sammen med testing Amazon OpenSearch Serverless. Vi dekker tre rørledninger som brukes til publisering, utfylling og spørring uten å introdusere piggete urealistiske trafikkmønstre, og uten noen innvirkning på produksjonstjenester.

Det er to hovedarkitektoniske deler som er kritiske for prosessen:

En varig kilde til sannhet for indeksdata. Det er beste praksis og en del av vår backup-strategi for å ha en holdbar butikk utover OpenSearch-indeksen, og Amazon DynamoDB gir skalerbarhet og integrasjon med AWS Lambda som forenkler mye av prosessen. Vi bruker DynamoDB for andre ikke-søketjenester, så dette passet naturlig.
En Lambda-funksjon for å publisere data fra sannhetens kilde til OpenSearch. Ved hjelp av funksjonsaliaser hjelper til med å kjøre flere konfigurasjoner av samme Lambda-funksjon samtidig og er nøkkelen til å holde data synkronisert.

Publisering

Publiseringspipelinen er drevet fra hendelser som en bruker som skriver inn søkeord eller bildetekster, nye opplastinger eller etikettgjenkjenning gjennom Amazon-anerkjennelse. Disse hendelsene behandles, og kombinerer data fra noen få andre aktivabutikker som Amazon Aurora MySQL-kompatibel utgave og Amazon Simple Storage Service (Amazon S3), før du skriver et enkelt element inn i DynamoDB.

Å skrive til DynamoDB påkaller en Lambda-publiseringsfunksjon, gjennom DynamoDB Streams Kinesis Adapter, som tar et parti med oppdaterte elementer fra DynamoDB og indekserer dem i OpenSearch. Det er andre fordeler med å bruke DynamoDB Streams Kinesis Adapter som å redusere antall samtidige lambdaer som kreves.

Den publiserende Lambda-funksjonen bruker miljøvariabler for å bestemme hvilket OpenSearch-domene og hvilket indeks som skal publiseres til. Et produksjonsalias er konfigurert til å skrive til produksjons OpenSearch-domenet, utenfor DynamoDB-tabellen eller Kinesis Stream

Når du tester nye konfigurasjoner eller migrerer, konfigureres et migreringsalias til å skrive til det nye OpenSearch-domenet, men bruke samme utløser som produksjonsaliaset. Dette muliggjør dobbel indeksering av data til begge OpenSearch Service-domenene samtidig.

Her er et eksempel på DynamoDB-tabellskjemaet:

 "Id": 123456, // partition key "Fields": { "format": "JPG", "height": 1024, "width": 1536, ... }, "LastUpdated": 1600107934,

'LastUpdated'-verdien brukes som dokumentversjon ved indeksering, slik at OpenSearch kan avvise eventuelle oppdateringer som ikke er i orden.

Fylling på nytt

Nå som endringer publiseres på begge domenene, må det nye domenet (indeksen) fylles ut med historiske data. For å fylle ut en nyopprettet indeks, en kombinasjon av Amazon Simple Queue Service (Amazon SQS) og DynamoDB brukes. Et skript fyller ut en SQS-kø med meldinger som inneholder instruksjoner for parallell skanning et segment av DynamoDB-tabellen.

SQS-køen lanserer en Lambda-funksjon som leser meldingsinstruksjonene, henter en gruppe varer fra det tilsvarende segmentet i DynamoDB-tabellen og skriver dem inn i en OpenSearch-indeks. Nye meldinger skrives til SQS-køen for å holde oversikt over fremdriften gjennom segmentet. Etter at segmentet er fullført, blir det ikke skrevet flere meldinger til SQS-køen, og prosessen stopper seg selv.

Samtidighet bestemmes av antall segmenter, med tilleggskontroller levert av Lambdas samtidighetsskalering. SmugMug er i stand til å indeksere mer enn 1 milliard dokumenter i timen på deres OpenSearch-konfigurasjon, samtidig som det ikke har noen innvirkning på produksjonsdomenet.

Et NodeJS AWS-SDK-basert skript brukes til å seede SQS-køen. Her er et utdrag av SQS-konfigurasjonsskriptets alternativer:

Usage: queue_segments [options] Options:
--search-endpoint <url> OpenSearch endpoint url
--sqs-url <url> SQS queue url
--index <string> OpenSearch index name
--table <string> DynamoDB table name
--key-name <string> DynamoDB table partition key name
--segments <int> Number of parallel segments

Sammen med formatet til den resulterende SQS-meldingen:

{ searchEndpoint: opts.searchEndpoint, sqsUrl: opts.sqsUrl, table: opts.table, keyName: opts.keyName, index: opts.index, segment: i, totalSegments: opts.segments, exclusiveStartKey: <lastEvaluatedKey from previous iteration>
}

Etter hvert som hvert segment behandles, legges 'lastEvaluatedKey' fra forrige iterasjon til meldingen som 'exclusiveStartKey' for neste iterasjon.

Speiling

Sist, vår speilet søk resultater kjøres ved å sende en OpenSearch-spørring til en SQS-kø, i tillegg til produksjonsdomenet vårt. SQS-køen lanserer en Lambda-funksjon som spiller av spørringen på nytt til replikadomenet. Søkeresultatene fra disse forespørslene sendes ikke til noen brukere, men tillater replikering av produksjonsbelastning på OpenSearch-tjenesten som testes uten innvirkning på produksjonssystemer eller kunder.

konklusjonen

Når vi evaluerer et nytt OpenSearch-domene eller -konfigurasjon, er de viktigste beregningene vi er interessert i ytelse for spørringsforsinkelser, nemlig forsinkelser som har tatt (latenser per gang), og viktigst av alt forsinkelser for søk. I vår overgang til Graviton R6gd så vi omtrent 40 prosent lavere P50-P99-forsinkelser, sammen med lignende gevinster i CPU-bruk sammenlignet med i3-er (ignorerer Gravitons lavere kostnader). En annen velkommen fordel var det mer forutsigbare og overvåkerbare JVM-minnetrykket med søppeloppsamlingsendringene fra tillegget av G1GC på R6gd og andre nye forekomster.

Ved å bruke denne pipelinen tester vi også OpenSearch Serverless og finner de beste bruksområdene. Vi er begeistret for den tjenesten og har fullt ut til hensikt å ha en helt serverløs arkitektur i tide. Følg med for resultater.

Om forfatterne

Lee Shepherd er en SmugMug Staff Software Engineer

Aydn Bekirov er en Amazon Web Services Principal Technical Account Manager

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
kilde: https://aws.amazon.com/blogs/big-data/smugmugs-durable-search-pipelines-for-amazon-opensearch-service/

Tidstempel: Oktober 19, 2023

Tidstempel: April 11, 2023

Publisert av Platon

Håndter UPSERT-dataoperasjoner ved å bruke åpen kildekode Delta Lake og AWS Glue

Toppstrategier for høyvolumsporing med Amazon OpenSearch Ingestion

Apache Iceberg-optimalisering: Løser problemet med små filer i Amazon EMR | Amazon Web Services

Trakstar åpner for nye analytiske muligheter for sine HR-kunder med Amazon QuickSight | Amazon Web Services

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn