Analyser sikkerhedsresultater hurtigere med dataforberedelse uden kode ved hjælp af generativ AI og Amazon SageMaker Canvas | Amazon Web Services

Genudgivet af Platon

Abonnenter: 0

Data er grundlaget for at fange den maksimale værdi fra AI-teknologi og løse forretningsproblemer hurtigt. For at frigøre potentialet i generative AI-teknologier er der dog en nøgleforudsætning: dine data skal forberedes korrekt. I dette indlæg beskriver vi, hvordan du bruger generativ AI til at opdatere og skalere din datapipeline ved hjælp af Amazon SageMaker lærred til dataforberedelse.

Datapipeline-arbejde kræver typisk en specialiseret færdighed til at forberede og organisere data, som sikkerhedsanalytikere kan bruge til at udtrække værdi, hvilket kan tage tid, øge risici og øge time-to-value. Med SageMaker Canvas kan sikkerhedsanalytikere ubesværet og sikkert få adgang til førende fundamentmodeller for at forberede deres data hurtigere og afhjælpe cybersikkerhedsrisici.

Dataforberedelse involverer omhyggelig formatering og gennemtænkt kontekstualisering, der arbejder baglæns fra kundeproblemet. Nu med SageMaker Canvas-chatten til dataforberedelse kan analytikere med domæneviden hurtigt forberede, organisere og udtrække værdi fra data ved hjælp af en chat-baseret oplevelse.

Løsningsoversigt

Generativ AI revolutionerer sikkerhedsdomænet ved at levere personlige og naturlige sprogoplevelser, forbedre risikoidentifikation og afhjælpning, samtidig med at virksomhedens produktivitet øges. Til denne brugssag bruger vi SageMaker Canvas, Amazon SageMaker Data Wrangler, Amazon Security Lakeog Amazon Simple Storage Service (Amazon S3). Amazon Security Lake giver dig mulighed for at aggregere og normalisere sikkerhedsdata til analyse for at få en bedre forståelse af sikkerheden på tværs af din organisation. Amazon S3 giver dig mulighed for at gemme og hente enhver mængde data til enhver tid og sted. Det tilbyder brancheførende skalerbarhed, datatilgængelighed, sikkerhed og ydeevne.

SageMaker Canvas understøtter nu omfattende dataforberedelsesfunktioner drevet af SageMaker Data Wrangler. Med denne integration giver SageMaker Canvas et end-to-end no-code arbejdsområde til at forberede data, bygge og bruge machine learning (ML) og Amazonas grundfjeld grundmodeller til at fremskynde tiden fra data til forretningsindsigt. Du kan nu opdage og samle data fra over 50 datakilder og udforske og forberede data ved hjælp af over 300 indbyggede analyser og transformationer i SageMaker Canvas visuelle grænseflade. Du vil også se hurtigere ydeevne for transformationer og analyser og drage fordel af en naturlig sproggrænseflade til at udforske og transformere data til ML.

I dette indlæg demonstrerer vi tre centrale transformationer; filtrering, kolonneomdøbning og tekstudtrækning fra en kolonne på datasættet med sikkerhedsresultater. Vi demonstrerer også brugen af chat til dataforberedelsesfunktionen i SageMaker Canvas til at analysere dataene og visualisere dine resultater.

Forudsætninger

Før du starter, skal du have en AWS-konto. Du skal også opsætte en Amazon SageMaker Studio domæne. For instruktioner om opsætning af SageMaker Canvas, se Generer maskinlæringsforudsigelser uden kode.

Få adgang til SageMaker Canvas chatgrænseflade

Udfør følgende trin for at begynde at bruge SageMaker Canvas-chatfunktionen:

Vælg på SageMaker Canvas-konsollen Data Wrangler.
Under datasæt, vælg Amazon S3 som din kilde og angiv sikkerhedsfund datasæt fra Amazon Security Lake.
Vælg dit dataflow og vælg Chat til dataforberedelse, som vil vise en chat-grænsefladeoplevelse med guidede prompter.

Filtrer data

For dette indlæg ønsker vi først at filtrere for kritiske advarsler og advarsler med høj alvorlighed, så vi indtaster instruktionerne i chatboksen for at fjerne fund, der ikke er kritiske eller høje alvorlige. Canvas fjerner rækkerne, viser en forhåndsvisning af transformerede data og giver mulighed for at bruge koden. Vi kan tilføje det til listen over trin i Steps rude.

Omdøb kolonner

Dernæst vil vi omdøbe to kolonner, så vi indtaster følgende prompt i chatboksen for at omdøbe desc , titel kolonner til Finde , Oprydning. SageMaker Canvas genererer en forhåndsvisning, og hvis du er tilfreds med resultaterne, kan du tilføje de transformerede data til dataflowtrinnene.

Uddrag tekst

For at bestemme kilden Regioner af resultaterne, kan du indtaste i chat instruktioner til Udtræk Regionsteksten fra UID-kolonnen baseret på mønsteret arn:aws:security:securityhub:region:* og opret en ny kolonne kaldet Region) for at udtrække regionteksten fra UID-kolonnen baseret på et mønster. SageMaker Canvas genererer derefter kode for at oprette en ny regionskolonne. Dataforhåndsvisningen viser, at resultaterne stammer fra én region: us-west-2. Du kan tilføje denne transformation til datastrømmen til downstream-analyse.

Analyser dataene

Til sidst ønsker vi at analysere dataene for at afgøre, om der er en sammenhæng mellem tidspunktet på dagen og antallet af kritiske fund. Du kan indtaste en anmodning om at opsummere kritiske resultater efter tidspunkt på dagen i chatten, og SageMaker Canvas returnerer indsigter, der er nyttige til din undersøgelse og analyse.

Visualiser resultater

Dernæst visualiserer vi resultaterne efter sværhedsgrad over tid for at inkludere dem i en ledelsesrapport. Du kan bede SageMaker Canvas om at generere et søjlediagram af sværhedsgrad sammenlignet med tidspunktet på dagen. På få sekunder har SageMaker Canvas lavet diagrammet grupperet efter sværhedsgrad. Du kan tilføje denne visualisering til analysen i dataflowet og downloade den til din rapport. Dataene viser, at resultaterne stammer fra én region og sker på bestemte tidspunkter. Dette giver os tillid til, hvor vi skal fokusere vores undersøgelse af sikkerhedsresultater for at fastslå grundlæggende årsager og korrigerende handlinger.

Ryd op

For at undgå at pådrage sig utilsigtede debiteringer skal du udføre følgende trin for at rydde op i dine ressourcer:

Tøm den S3-spand, du brugte som kilde.
Log ud af SageMaker Canvas.

Konklusion

I dette indlæg viste vi dig, hvordan du bruger SageMaker Canvas som et end-to-end no-code-arbejdsområde til dataforberedelse til at bygge og bruge Amazon Bedrock-fundamentmodeller til at fremskynde tiden til at indsamle forretningsindsigt fra data.

Bemærk, at denne tilgang ikke er begrænset til sikkerhedsfund; du kan anvende dette på enhver generativ AI-brugscase, der bruger dataforberedelse i sin kerne.

Fremtiden tilhører virksomheder, der effektivt kan udnytte kraften i generativ AI og store sprogmodeller. Men for at gøre det skal vi først udvikle en solid datastrategi og forstå kunsten at forberede data. Ved at bruge generativ AI til at strukturere vores data intelligent og arbejde baglæns fra kunden, kan vi løse forretningsproblemer hurtigere. Med SageMaker Canvas-chat til dataforberedelse er det nemt for analytikere at komme i gang og fange øjeblikkelig værdi fra AI.

Om forfatterne

Sudeesh Sasidharan er Senior Solutions Architect hos AWS, indenfor Energy-teamet. Sudeesh elsker at eksperimentere med nye teknologier og bygge innovative løsninger, der løser komplekse forretningsmæssige udfordringer. Når han ikke designer løsninger eller roder med de nyeste teknologier, kan du finde ham på tennisbanen, der arbejder på sin baghånd.

John Klacynski er en Principal Customer Solution Manager i AWS Independent Software Vendor (ISV) team. I denne rolle hjælper han programmatisk ISV-kunder med at adoptere AWS-teknologier og -tjenester for at nå deres forretningsmål hurtigere. Før han kom til AWS, ledede John Data Product Teams for store Consumer Package Goods-virksomheder og hjalp dem med at udnytte dataindsigt til at forbedre deres drift og beslutningstagning.