I dette indlæg viser vi, hvordan du kan bruge AWS rene værelser at muliggøre datasamarbejde mellem offentlige sundhedsmyndigheder. Offentlige sundhedsmyndigheder er nødt til at forstå tendenser relateret til en række sundhedstilstande og pleje på tværs af befolkninger for at skabe politikker og behandlinger med det mål at forbedre velfærden i de forskellige samfund, de tjener.
For at gøre dette skal disse agenturer analysere data fra mange kilder, såsom kliniske organisationer, ikke-kliniske samfundsorganisationer og administrative data fra andre statslige agenturer, så de kan identificere tendenser omkring sundhedstilstande og behandlinger på tværs af befolkningsgrupper. Folkesundheden skal forstå, hvad der sker med befolkningerne i de samfund, de tjener.
Fordi de ser på risikogrupper, har de brug for fleksibiliteten i en linjeliste over sager, der er fritaget for personlig identificerbar information (PII). Med disse oplysninger kan de vurdere risiko baseret på en række demografiske og sociale faktorer, der er tilgængelige i datakilderne uden at afsløre PII. Listen giver dem fleksibilitet til også at anvende mere komplekse analyser, såsom regression, på de linkede data. Programmer som BETTER, MDPHnetog KODER har undersøgt at bruge kliniske data i distribuerede netværk til at forstå byrden af kroniske sygdomme i samfund i årevis. Udfordringerne for disse programmer omfatter komplekse datadelingsregler og distribuerede analysetilgange på tværs af netværk af dataudbydere. MENDS og MDPHnet kører for eksempel analyser på organisationsniveau uden at deduplikere på tværs af websteder. Individuelle forespørgsler skubbes til hvert websted, hvor de behandles og gennemgås af mennesker, og kombineret output sendes til det offentlige sundhedsagentur.
AWS Clean Rooms giver mulighed for at reducere byrden på dataudbydere i programmer som disse, samtidig med at offentlige sundhedsmyndigheder kan analysere data ved hjælp af deres egne forespørgsler og mindske risici for databeskyttelse ved at forhindre adgang til de underliggende rådata.
Oversigt over AWS Clean Rooms
AWS rene værelser blev først annonceret på AWS re:Invent 2022, og er nu generelt tilgængelig. AWS Clean Rooms giver kunder og deres partnere mulighed for lettere og sikkert at samarbejde om deres samlede datasæt – uden at dele eller kopiere de underliggende data med hinanden. AWS Clean Rooms tilbyder et bredt sæt af privatlivsforbedrende kontroller, der hjælper med at beskytte følsomme data, herunder forespørgselskontroller, forespørgselsoutputbegrænsninger, forespørgselslogning og kryptografiske computerværktøjer.
Med AWS Clean Rooms kan du samarbejde og analysere data med andre parter i samarbejdet, uden at nogen af parterne skal dele eller kopiere rådataene. AWS Clean Rooms er en statsløs tjeneste; den gemmer ikke dataene. I stedet læser den dataene, hvorfra den bor, anvender begrænsninger, der beskytter hver deltagers underliggende data ved forespørgselskørsel, og returnerer resultaterne. Forespørgsler kan skrives for at skære og analysere datakilder ved hjælp af almindelige metadataelementer (f.eks. geografi, delte identifikatorer eller andre demografiske faktorer), der genererer lister på rækkeniveau over overlapningen mellem datakilderne eller aggregerede optællinger efter population, tilstand eller andre lag.
AWS Clean Rooms hjælper offentlige sundhedsagenturer med at analysere kollektive data for at få et mere fuldstændigt overblik over sundhed og velvære i deres lokalsamfund, samtidig med at dataenes sikkerhed og privatliv bevares.
Løsningsoversigt
Før vi går i gang med AWS Clean Rooms, lad os først tale om nogle af tjenestens nøglekoncepter:
- Samarbejder – Dette er en sikker logisk grænse i AWS Clean Rooms skabt af samarbejdsskaberen. Når du opretter samarbejdet, kan skaberen invitere yderligere medlemmer til at deltage i samarbejdet. Inviterede deltagere kan se listen over samarbejdsmedlemmer, før de accepterer invitationen til at deltage i samarbejdet.
- Medlemmer – Dette refererer til AWS-kunder, der er deltagere i et samarbejde. Alle samarbejdsmedlemmer kan tilslutte sig data; dog kan kun ét medlem forespørge og modtage resultater pr. samarbejde, og det medlem er uforanderligt.
- Analyse regler – AWS Clean Rooms understøtter to typer analyseregler:
- Sammenlægning – Medlemmer kan køre forespørgsler, der samler statistik ved hjælp af funktionerne COUNT, SUM eller AVG langs valgfrie dimensioner. Aggregeringsforespørgsler afslører ikke data på rækkeniveau.
- Liste – Medlemmer kan køre forespørgsler, der udsender data på rækkeniveau for overlapningen mellem to tabeller.
- Konfigurerede tabeller – Medlemmer kan konfigurere eksisterende AWS Lim borde til brug i AWS Clean Rooms. Disse data er gemt i Amazon Simple Storage Service (Amazon S3) i åbne dataformater og katalogiseret i AWS Glue Data Catalog. Hver konfigureret tabel indeholder en analyseregel, der bestemmer, hvordan dataene kan forespørges. Når den er konfigureret, kan medlemmer knytte den konfigurerede tabel til et eller flere samarbejder.
Kom godt i gang med AWS Clean Rooms er en fire-trins proces:
- Opretteren konfigurerer et samarbejde og inviterer et eller flere medlemmer til samarbejdet.
- Det inviterede medlem tilslutter sig samarbejdet.
- Medlemmer kan konfigurere de eksisterende AWS Lim-borde til brug i AWS Clean Rooms.
- Medlemmer med tilladelse hertil kan køre forespørgsler i samarbejdet.
Forudsætninger
Til denne gennemgang skal du bruge følgende:
Opret et samarbejde og inviter et eller flere medlemmer
Du skal definere din samarbejdskonfiguration på AWS Clean Rooms-konsollen via AWS kommandolinjegrænseflade (AWS CLI), eller med et AWS SDK. Vi demonstrerer, hvordan du konfigurerer dette på konsollen.
- På AWS Clean Rooms-konsollen skal du vælge Skab samarbejde.
- Til Navn, indtast et navn (f.eks. Demo-samarbejde).
- Til Beskrivelse, tilføj en valgfri beskrivelse.
- I Medlemmer sektion, tilføje følgende medlemmer:
- Medlem 1 – Indtast et medlemsvisningsnavn (dit AWS-konto-id udfyldes automatisk).
- Medlem 2 – Indtast et medlemsvisningsnavn og AWS-konto-id for det medlem, du vil invitere.
- Vælg Tilføj endnu et medlem for at tilføje flere medlemmer.
- I Medlemmernes evner skal du vælge et medlem, der vil forespørge og modtage resultater.
- I Forespørgselslogning sektion, vælg Support forespørgselslogning for dette samarbejde for at logge forespørgslerne ind amazoncloudwatch logfiler.
- Vælg Næste.
- I Samarbejdsmedlemskab sektion, skal du vælge den lagerindstilling, du foretrækker til CloudWatch.
- Vælg Næste.
- På Gennemgå og opret side, vælg Skab samarbejde og medlemskab efter at have gennemgået detaljerne for at sikre nøjagtigheden.
Tillykke med oprettelsen af dit første samarbejde! Du kan se samarbejdsdetaljerne på Samarbejder .
Deltag i samarbejdet
Hvert samarbejdsmedlem kan logge ind på AWS Clean Rooms-konsollen, gennemgå invitationen og beslutte at deltage i samarbejdet ved at følge disse trin:
- På AWS Clean Rooms-konsollen skal du vælge Samarbejder i navigationsruden.
- På Mulighed for at deltage fanen, skal du vælge det samarbejde, du blev inviteret til.
På siden med detaljer kan du gennemgå medlemsevnerne.
- Vælg din foretrukne loglagringsindstilling og vælg Opret medlemskab.
- På bekræftelsessiden skal du kontrollere, at de anførte medlemmer stemmer overens med dine aftaler om datadeling, og vælg derefter Opret medlemskab.
Når du har oprettet dit medlemskab, ændres din medlemsstatus til Aktiv på samarbejdsdashboardet.
Konfigurer eksisterende AWS Lim-borde til brug i AWS Clean Rooms
AWS Clean Rooms kræver ikke, at du laver en kopi af dataene, fordi det læser dataene fra Amazon S3. Dette eliminerer behovet for at kopiere og indlæse dine data til destinationer uden for din respektive AWS-konto eller bruge tredjepartstjenester til at lette datadeling.
Hvert samarbejdsmedlem kan oprette konfigurerede tabeller, en AWS Clean Rooms-ressource, der indeholder reference til AWS Glue Data Catalog med underliggende data, der definerer, hvordan disse data kan bruges. Den konfigurerede tabel kan bruges på tværs af mange samarbejder.
- På AWS Clean Rooms-konsollen skal du vælge Konfigurerede tabeller i navigationsruden.
- Vælg Konfigurer ny tabel.
- Vælg databasen for at udfylde listen over AWS Glue-tabeller, og vælg den tabel, du vil knytte til samarbejdet.
For hver valgt tabel kan du bestemme, hvilke kolonner der kan tilgås i samarbejdet.
- Type Alle kolonner eller vælg Brugerdefineret liste at vælge et undersæt af kolonner, der skal være tilgængelige i samarbejdet.
- Indtast et navn til den konfigurerede tabel.
- Vælg Konfigurer ny tabel.
Ud over adgangskontroller på kolonneniveau tilbyder AWS Clean Rooms finkornede forespørgselskontroller kaldet analyseregler. Med indbyggede og fleksible analyseregler kan du skræddersy forespørgsler til specifikke forretningsbehov. Som diskuteret tidligere, tilbyder AWS Clean Rooms to typer analyseregler:
- Regler for aggregationsanalyse – Disse tillader forespørgsler, der samler data uden at afsløre oplysninger på rækkeniveau. Tilgængelige funktioner omfatter COUNT, SUM og AVG sammen med valgfrie dimensioner.
- Liste analyseregler – Disse tillader forespørgsler, der udsender attributanalyser på rækkeniveau af overlapningen mellem tabellerne i samarbejdsrummet.
Begge regeltyper giver dataejere mulighed for at give mandat til en joinforbindelse mellem deres datasæt og datasættene for den samarbejdspartner, der kører forespørgslen. Dette begrænser resultaterne til kun deres skæringspunkt mellem samarbejdspartnernes datasæt.
- På den konfigurerede tabel skal du vælge Konfigurer analyseregel at konfigurere analysereglerne.
- Til dette indlæg vælger vi Liste fordi vi ønsker at forespørge patienters immuniseringsstatus ved at slutte sig til immuniseringsdata fra andre bidragydere.
- Vælg oprettelsesmetoden og vælg Næste.
- For at definere kriterierne for tabellen joins, i Deltag i kontroller skal du vælge de kolonnenavne, der passer til sammenføjningen.
- For at angive, hvilke kolonner der skal udskrives, skal du identificere dem i Liste kontroller sektion.
- Vælg Næste.
- Vælg Konfigurer analyseregel på den Gennemgå og konfigurer .
Du vil se beskeden Listeanalyseregel er konfigureret med succes på siden med konfigurerede tabeller.
- Vælg Tilknyttet samarbejde for at linke denne tabel til det samarbejde, du har oprettet.
- Gennemgå detaljerne på Associeret tabel side og vælg Associeret tabel.
Samarbejdssiden vil vise en liste over tabeller, som du har knyttet til samarbejdet.
Hvert medlem af samarbejdet skal gentage de førnævnte trin for at knytte deres AWS Glue Data Catalog-tabeller til samarbejdet. For dette indlæg følger de andre medlemmer af samarbejdet de samme trin for at knytte deres data til samarbejdet. Derefter vil samarbejdet liste alle tabeller, der er tilknyttet af andre medlemmer.
Efter at have defineret analysereglerne på de konfigurerede tabeller og knyttet dem til samarbejdet, kan de medlemmer, der kan forespørge og modtage resultater, begynde at skrive forespørgsler i henhold til de begrænsninger, der er defineret af hvert deltagende samarbejdsmedlem. Det følgende afsnit indeholder eksempler på samarbejdsforespørgsler.
Kør forespørgsler i samarbejdet
Følgende skærmbillede er et eksempel på en forespørgsel, der ikke vil lykkes, fordi * ikke understøttes. Kolonnenavne skal angives i forespørgslen.
Følgende skærmbillede er et eksempel på en forespørgsel, der ikke vil lykkes, fordi du ikke kan linke kolonner, som medlemmer har begrænset i dine joins.
Følgende skærmbillede er et eksempel på en forespørgsel, der vil lykkes, fordi den bruger tilladte kolonner (kolonner, der er en del af listeanalysereglen) i select-udtrykket og join-betingelsen.
Eksempeldatasættene (patient og immunisering), der bruges i dette indlæg, inkluderer en unik identifikator (patient-id). Men i et scenarie i den virkelige verden er dette muligvis ikke tilfældet. I disse situationer kan du overveje at bruge PPRL (privacy-preserving record linkage) til at skabe et unikt afidentificeret token. For eksempel deduplikerer CDC's CODI-program på tværs af dataejere ved at sløre PII bag hver organisations firewall på en standardiseret måde. Denne slørede information sammenføjes for at skabe et unikt afidentificeret token for hver enkelt person, der analyseres på tværs af datakilder. Hvis offentlige sundhedsmyndigheder ønsker at udføre analyser baseret på individuelt linkede longitudinelle data, kan de anvende PPRL til hver datakilde og bruge det metadataelement til at linke datakilderne i AWS Clean Rooms, før de udfører deres analyser.
Ryd op
Som en del af denne gennemgang sørgede du for et AWS Clean Rooms-samarbejde, inviterede andre medlemmer til at deltage i samarbejdet og konfigurerede tabeller. For at slette disse ressourcer, se Forlader samarbejdet , Frakobling af konfigurerede tabeller.
Konklusion
I dette indlæg viste vi dig, hvordan du opretter et samarbejde, inviterer andre medlemmer til samarbejdet, konfigurerer eksisterende AWS Glue Catalog-tabeller, anvender analyseregler og kører prøveforespørgsler på AWS Clean Rooms-konsollen. I del 2 af denne serie demonstrerer vi, hvordan man automatiserer forespørgselskørsel ved hjælp af AWS Lambda, forespørg resultaterne ved hjælp af Amazonas Athena, og udgiv dashboards ved hjælp af Amazon QuickSight.
Om forfatterne
Venkata Kampana er Senior Solutions Architect i AWS Health and Human Services-teamet og er baseret i Sacramento, CA. I den rolle hjælper han offentlige kunder med at nå deres missionsmål med veldesignede løsninger på AWS.
Dr. Dawn Heisey-Grove er leder for folkesundhedsanalyse for Amazon Web Services' statslige og lokale regeringsteam. I denne rolle er hun ansvarlig for at hjælpe statslige og lokale offentlige sundhedsagenturer med at tænke kreativt over, hvordan de kan nå deres analytiske udfordringer og langsigtede mål. Hun har brugt sin karriere på at finde nye måder at bruge eksisterende eller nye data til at understøtte folkesundhedsovervågning og forskning.
Jim Daniel er Public Health lead hos Amazon Web Services. Tidligere har han haft stillinger i USA's Department of Health and Human Services i næsten et årti, herunder direktør for Public Health Innovation og Public Health Coordinator. Før sin regeringstjeneste tjente Jim som Chief Information Officer for Massachusetts Department of Public Health.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- EVM Finans. Unified Interface for Decentralized Finance. Adgang her.
- Quantum Media Group. IR/PR forstærket. Adgang her.
- PlatoAiStream. Web3 Data Intelligence. Viden forstærket. Adgang her.
- Kilde: https://aws.amazon.com/blogs/big-data/part-1-enable-data-collaboration-among-public-health-agencies-with-aws-clean-rooms/
- :er
- :ikke
- :hvor
- 1
- 100
- 12
- 195
- 2022
- 7
- a
- evner
- Om
- Acceptere
- adgang
- af udleverede
- Ifølge
- Konto
- nøjagtighed
- opnå
- tværs
- tilføje
- Desuden
- Yderligere
- administrative
- Efter
- agenturer
- agentur
- aggregering
- aftaler
- tilpasse
- Alle
- tillade
- tillader
- sammen
- Amazon
- Amazon Web Services
- blandt
- an
- analyse
- analytics
- analysere
- analyseret
- ,
- annoncerede
- En anden
- Indløs
- tilgange
- passende
- ER
- omkring
- AS
- vurdere
- Associate
- forbundet
- At
- automatisere
- automatisk
- til rådighed
- AVG
- AWS
- AWS Lim
- AWS re: Invent
- baseret
- BE
- fordi
- før
- bag
- mellem
- bred
- indbygget
- byrde
- virksomhed
- by
- CA
- kaldet
- CAN
- hvilken
- Karriere
- tilfælde
- tilfælde
- katalog
- CDC
- udfordringer
- ændret
- chef
- Vælg
- Klinisk
- samarbejde
- samarbejde
- samarbejder
- kollektive
- Kolonne
- Kolonner
- kombineret
- Fælles
- Fællesskaber
- samfund
- fuldføre
- komplekse
- computing
- begreber
- betingelse
- betingelser
- Adfærd
- udførelse
- Konfiguration
- konfigureret
- bekræftelse
- Overvej
- Konsol
- indeholder
- bidragydere
- kontrol
- Koordinator
- kopiering
- kunne
- skabe
- oprettet
- Oprettelse af
- skabelse
- Kreativt
- skaberen
- kriterier
- kryptografisk
- Kunder
- instrumentbræt
- dashboards
- data
- databeskyttelse
- datadeling
- Database
- datasæt
- årti
- beslutte
- definerede
- definerer
- definere
- Demo
- demografiske
- demonstrere
- Afdeling
- beskrivelse
- destinationer
- detaljer
- Bestem
- bestemmer
- størrelse
- Direktør
- drøftet
- sygdomme
- Skærm
- distribueret
- do
- Er ikke
- hver
- tidligere
- nemt
- enten
- element
- elementer
- eliminerer
- muliggøre
- muliggør
- sikre
- Indtast
- Ether (ETH)
- eksempel
- eksisterende
- udforsket
- lette
- vender
- faktorer
- finde
- firewall
- Fornavn
- Fleksibilitet
- fleksibel
- følger
- efter
- Til
- fra
- funktioner
- Gevinst
- generelt
- generere
- geografi
- få
- giver
- mål
- Mål
- Regering
- statslige
- statslige organer
- Happening
- have
- he
- Helse
- Held
- hjælpe
- hjælpe
- hjælper
- hende
- hans
- Hvordan
- How To
- Men
- HTML
- http
- HTTPS
- menneskelig
- Mennesker
- ID
- identifikator
- identifikatorer
- identificere
- if
- uforanderlige
- forbedring
- in
- omfatter
- omfatter
- Herunder
- individuel
- Individuelt
- oplysninger
- Innovation
- i stedet
- vejkryds
- ind
- invitation
- invitere
- inviteret
- invitationer
- IT
- Jim
- deltage
- sluttede
- sammenføjning
- Sammenføjninger
- jpg
- lige
- Nøgle
- føre
- leder
- Niveau
- ligesom
- grænser
- Line (linje)
- LINK
- forbundet
- Liste
- Børsnoterede
- Lister
- Lives
- belastning
- lokale
- Lokal regering
- log
- logning
- logisk
- langsigtet
- leder
- opretholdelse
- lave
- Mandat
- mange
- Massachusetts
- Kan..
- medlem
- Medlemmer
- medlemskab
- besked
- Metadata
- metode
- måske
- Mission
- afbøde
- mere
- skal
- navn
- navne
- Navigation
- næsten
- Behov
- behov
- net
- Ny
- nu
- målsætninger
- of
- Tilbud
- Officer
- on
- ONE
- kun
- åbent
- åbne data
- Opportunity
- Option
- or
- ordrer
- organisation
- organisationer
- Andet
- output
- uden for
- egen
- ejere
- side
- brød
- del
- deltagere
- deltager
- parter
- partnere
- part
- patient
- tilladelse
- Personligt
- PIO
- plato
- Platon Data Intelligence
- PlatoData
- politikker
- befolkede
- befolkning
- populationer
- positioner
- Indlæg
- foretrække
- foretrækkes
- forebyggelse
- tidligere
- Beskyttelse af personlige oplysninger
- behandle
- bearbejdet
- Program
- Programmer
- beskytte
- udbydere
- giver
- offentlige
- folkesundheden
- offentliggøre
- skubbet
- forespørgsler
- Raw
- rådata
- RE
- virkelige verden
- modtage
- optage
- reducere
- refererer
- regression
- relaterede
- gentag
- kræver
- forskning
- ressource
- Ressourcer
- dem
- ansvarlige
- begrænset
- restriktioner
- Resultater
- afkast
- afsløre
- afslørende
- gennemgå
- revideret
- gennemgå
- Risiko
- risici
- roller
- Rum
- Herske
- regler
- Kør
- kører
- Sacramento
- samme
- scenarie
- SDK
- Sektion
- sektor
- sikker
- sikkert
- sikkerhed
- se
- valgt
- senior
- følsom
- sendt
- Series
- tjener
- tjeneste
- Tjenester
- sæt
- Del
- delt
- deling
- Vis
- viste
- Simpelt
- websted
- Websteder
- situationer
- So
- Social
- Løsninger
- nogle
- Kilde
- Kilder
- Space
- specifikke
- specificeret
- brugt
- starte
- påbegyndt
- Tilstand
- Stater
- statistik
- Status
- Steps
- opbevaring
- butik
- Gem dataene
- opbevaret
- vellykket
- sådan
- support
- Understøttet
- Understøtter
- overvågning
- bord
- Tal
- hold
- at
- deres
- Them
- derefter
- Disse
- de
- tror
- tredjepart
- denne
- dem
- til
- token
- værktøjer
- behandlinger
- Tendenser
- to
- typer
- underliggende
- forstå
- enestående
- Forenet
- Forenede Stater
- brug
- anvendte
- bruger
- ved brug af
- række
- forskellige
- verificere
- via
- Specifikation
- går igennem
- ønsker
- var
- Vej..
- måder
- we
- web
- webservices
- GODT
- var
- Hvad
- Hvad er
- hvornår
- som
- mens
- WHO
- vilje
- med
- inden for
- uden
- skrivning
- skriftlig
- år
- dig
- Din
- zephyrnet