Datatendenser i 2024: Fra kollaborativ datadeling til AI-drevne operationer - DATAVERSITY

Datatendenser i 2024: Fra kollaborativ datadeling til AI-drevne operationer – DATAVERSITY

Kildeknude: 3013137

I det hurtigt udviklende datalandskab er forståelse af nye tendenser og omfavnelse af teknologiske fremskridt nøglen til at være på forkant. Når vi nærmer os 2024, udforsker denne artikel de datatendenser, der vil definere det strategiske landskab for det kommende år.

Tendens: Fokus på data SHaring , Dved en Csamarbejde

Forbedring af datadeling og sikkert datasamarbejde mellem parter er ved at blive et nøgleområde. Virksomheder som Snowflake og Databricks omfavner denne idé, og den vinder indpas på tværs af forskellige industrier. 

I løbet af det sidste årti, digital transformation har ført til nedbrydning af forretningsprocesser og systemer i mindre stykker. Nogle af disse dele forbliver i virksomheden, mens andre er outsourcet til eksterne udbydere, hvilket skaber et komplekst økosystem. For eksempel kan global betalingsbehandlings digitale transformationsindsats nu berøre 10 eller 15 virksomheder, og data er spredt på alle disse forskellige parter. Data fra flere udbydere skal integreres for at kunne ses holistisk, og det er en udfordring.

Så dataprodukter bliver i stigende grad bygget op omkring ideen om at flette data på tværs af forskellige parter. Denne tendens forventes at fortsætte de næste par år, og mange dataprodukter vil blive bygget op omkring denne proces.

Tendens: Stigningen af ​​datanetværk

Begrebet data mesh har vundet indpas de sidste tre år. Det bringer to nøglekomponenter i højsædet. For det første introducerer det ideen om "data som et produkt", som involverer emballering af data i et veldefineret, synligt format, der kan bruges på en selvbetjeningsmåde uden direkte involvering fra dataproducenten. Dette koncept omfatter ikke kun rådata, men også analytiske modeller, såsom dem, der bruges til kundeafgang eller forebyggelse af svindel.

For det andet gør brugen af ​​selvbetjeningsplatforme til fremstilling af dataprodukter, ikke til business intelligence, forskellige forretningsenheder i stand til at skabe dataprodukter uden behov for separate dataplatforme. Dette reducerer omkostningerne og øger effektiviteten.

Store teknologiudbydere, herunder cloud-tjenester som Azure og AWS, indhenter og tilbyder løsninger til at administrere distribuerede data- og analyseplatforme på en datamesh-måde. Dette hjælper med at forbinde data på tværs af forskellige platforme og teknologier, hvilket giver et centraliseret overblik over datalandskabet.

Tendens: LLM'er vil spille en afgørende rolle i at forbedre datateknologi og datadrift

Generativ AI og store sprogmodeller (LLM) har potentialet til at transformere datarummet. Denne transformation omfatter implementering af GenAI-modeller inden for eksisterende datainfrastrukturer til opgaver som datateknik og datadrift. 

Endnu mere interessant er potentialet for disse teknologier til at løse rudimentære opgaver, såsom profilering, modellering og integration af data, strømlining af processer og forbedring af datakvalitet. LLM'er forventes at spille en afgørende rolle i at forbedre datateknik og datadrift.

Tendens: Virksomheder vil investere i dataopdagelsesværktøjer og datakataloger

Data Governance har udviklet sig i løbet af de sidste par år. Tidligere var det fokuseret på at sikre data og styring af risici, men det er siden skiftet til at gøre data bredt tilgængelige og samtidig minimere risici. Konceptet med data-som-et-produkt er den største ændring, fordi det flytter ansvaret til de teams, der producerer, ejer eller betjener dataene.

Virksomheder investerer i dataopdagelsesværktøjer og datakataloger for at få synlighed i deres data, herunder dets kilder, ejerskab, struktur og kvalitet. Data Governance involverer nu at gøre data synlige, opdagelige, genbrugelige og nyttige. 

Tendens: Stigende vægt på datakvalitet 

Dataobservabilitet har vundet popularitet i de sidste to eller tre år, drevet af den øgede brug af dataanalyse og behovet for datakvalitet. Det giver en detaljeret forståelse af data under kørsel, og hjælper organisationer med at spore datastrømmen og identificere datakvalitetsproblemer, driftsproblemer og ændringer af datasystemer. Det giver en masse værdi til ingeniører og driftsfolk i form af synlighed og forståelse for, hvad der foregår.

Dataobservationsværktøjer som Monte Carlo og Soda er dukket op for at imødekomme den stigende efterspørgsel efter forbedret datakvalitet og driftseffektivitet.

Et andet aspekt af denne tendens er den stigende investering i dataanalyse. Inden for dataanalyse afhænger den afledte værdi i høj grad af kvaliteten af ​​de data, der analyseres. Som følge heraf lægger organisationer større vægt på datakvalitet. Under denne proces bliver det tydeligt, at mange datakvalitetsproblemer ikke stammer fra fraværet af veldefinerede forretningsregler eller valideringsregler for dataene. I stedet stammer problemer ofte fra operationelle uoverensstemmelser, såsom ændringer foretaget af enkeltpersoner eller unøjagtigheder i data modtaget fra udbydere, blandt andre driftsmæssige udfordringer.

Dette er fem af de vigtigste datatendenser at være opmærksom på i 2024. Hvilke vil du tilføje til listen?

Tidsstempel:

Mere fra DATAVERSITET