Datakvalitetsvurdering: Måling af succes - DATAVERSITET

Datakvalitetsvurdering: Måling af succes – DATAVERSITET

Kildeknude: 2903188
vurdering af datakvalitetvurdering af datakvalitet

Målet med en datakvalitetsvurdering er ikke kun at identificere ukorrekte data, men også at estimere skaden på virksomhedens processer og at implementere korrigerende handlinger. Mange store virksomheder kæmper for at opretholde kvaliteten af ​​deres data. 

Det er vigtigt at huske, at data ikke altid er lagret og statisk, men bliver brugt med jævne mellemrum. Efter at være blevet oprettet, bliver data downloadet, justeret, omformateret, udvekslet og endda ødelagt. 

Hvis det udføres forkert, kommer hver handling med truslen om at have en negativ indvirkning på datakvaliteten. Til gengæld kan dårlig datakvalitet resultere i flaskehalse og påvirker ofte de beslutninger, som en organisation træffer negativt. Uden det rigtige målesystem på plads vil data af lav kvalitet måske aldrig blive bemærket eller rettet.

Mange virksomheder ved ikke, at de har problemer med datakvalitet. Vurdering af datakvaliteten er en lille, men meget vigtig del af maksimering af en virksomheds effektivitet. Problemer med datakvaliteten kan først bemærkes af organisationens forretningsdrift eller af dens it-afdeling. De indledende trin i at udføre en vurdering af datakvaliteten kan betragtes som en "bevidsthedsfase". 

En datakvalitetsvurdering understøtter udviklingen af ​​en datastrategi, og en velorganiseret datastrategi vil tilpasse dataene og understøtte virksomhedens mål, værdier og mål.

Dataprofilering vs. Datakvalitetsvurderings

Dataprofilering betragtes ofte som et foreløbigt skridt til at udføre en datakvalitetsvurdering, mens nogle mennesker mener, at de to skal udføres samtidigt. Dataprofilering beskæftiger sig med forståelse af dataens struktur, samt dets indhold og indbyrdes sammenhænge. En datakvalitetsvurdering vurderer og identificerer på den anden side en organisations dataproblemer og konsekvenserne af disse problemer.

Nyttige datakvalitetsvurderingsmålinger

Datakvalitetsvurderingsmålinger måler blandt andet, hvor relevante, pålidelige, nøjagtige og konsistente en organisations data er. Afhængigt af en virksomheds type branche og mål, kan specifikke målinger være nødvendige for at afgøre, om organisationens data opfylder dens kvalitetskrav. Måling af kvaliteten af ​​dataene, forståelse af, hvordan datamålinger bruges, og hvordan værktøjerne og bedste praksis fungerer, er et nødvendigt skridt i at blive en datastyret organisation. 

Grundlæggende datakvalitetsmålinger omfatter:

Relevans: Dataene kan være af høj kvalitet, men ubrugelige i forhold til at hjælpe organisationen med at nå sine mål. For eksempel vil en virksomhed, der fokuserer på at sælge skræddersyede støvler, være interesseret i nyttige forsendelsesdata, men ville ikke have nogen interesse i en liste over personer, der søger produkter til reparation af støvler. At gemme data med det vage håb, at det bliver relevant senere, er en almindelig fejl. Metaplan tilbyder software til måling af relevans.  

Nøjagtighed: Ofte betragtet som den vigtigste måling for datakvalitet, bør nøjagtighed måles gennem dokumentation af kilden eller en anden uafhængig bekræftelsesteknik. Nøjagtighedsmetrikken inkluderer også statusændringer af dataene, når de sker i realtid.

Rettidighed: Forældede data spænder fra ubrugelige til potentielt skadelige. For eksempel vil kundekontaktdata, der aldrig opdateres, skade marketingkampagner og annoncering. Der er også mulighed for at sende produkter til den gamle, ikke længere korrekte adresse. God forretning kræver, at alle data er opdateret for at sikre smidige effektive forretningsprocesser.

Fuldstændighed: Datafuldstændighed bestemmes normalt ved at beslutte, om hver af dataindtastningerne er en "komplet" dataindtastning. Ufuldstændige data giver ofte ikke brugbar forretningsindsigt. I mange situationer er processen med at vurdere fuldstændighed en subjektiv måling foretaget af en dataprofessionel og ikke datakvalitetssoftware.

Integritet: Dataintegritet beskriver den overordnede nøjagtighed, konsistens og fuldstændighed af dataene gennem hele deres livscyklus. Dataintegritet er også forbundet med sikkerheden af ​​dataene med hensyn til overholdelse af lovgivning vedrørende personligt privatliv og sikkerhed.

Konsistens: Forskellige versioner af de samme data kan gøre forretninger forvirrende. Data og information skal være konsistente på tværs af alle virksomhedens systemer for at undgå forvirring. Heldigvis er software tilgængelig, så hver version af dataene skal ikke sammenlignes manuelt. (Stamdata og dens ledelse er en mulighed for at centralisere data, der bruges gentagne gange, og undgå flere versioner.)

Forberedelse til vurdering 

En datakvalitetsvurdering vil bevæge sig mere effektivt og give bedre resultater, hvis der oprettes en liste over bekymringer og mål før vurderingen. Når du opretter denne liste, skal du være opmærksom på organisationens langsigtede mål, mens du noterer kortsigtede mål. Eksempelvis kan det langsigtede mål om at effektivisere forretningen nedbrydes i mindre mål, såsom at rette systemet op, så de rigtige personer får de rigtige regninger, og at alle kundernes adresser er korrekte mv. 

Denne liste kan også præsenteres for en bestyrelse som begrundelse for at starte og betale for datakvalitetsvurderingssoftware eller hyre en entreprenør til at udføre vurderingen. De grundlæggende trin til oprettelse af listen er præsenteret nedenfor.

  • Start med at lave en liste over problemer med datakvalitet, der er opstået i løbet af det sidste år.
  • Brug en uge eller to på at observere datastrømmen og afgør, hvad der ser tvivlsomt ud, og hvorfor.
  • Del dine observationer med andre ledere og medarbejdere, få feedback, og juster resultaterne ved hjælp af feedback.
  • Undersøg listen over problemer med datakvalitet og afgør, hvilke der er de højeste prioriteter, baseret på hvordan de påvirker omsætningen.
  • Omskriv listen, så prioriteterne er listet først. (Denne liste kan stilles til rådighed for bestyrelsen og entreprenøren for datakvalitetsvurdering, efter at omfanget er fastlagt.)
  • Fastlæg omfanget – hvilke data vil der blive set på under vurderingen?
  • Bestem, hvem der bruger dataene, og undersøg deres databrugsadfærd før og efter vurderingen for at afgøre, om de skal foretage ændringer.

Datakvalitetsvurderingsplatforme

At udføre en datakvalitetsvurdering manuelt kræver så meget indsats, at de fleste ledere aldrig ville godkende det. Heldigvis findes der datakvalitetsplatforme og -løsninger. Nogle har en holistisk tilgang, mens andre fokuserer på bestemte platforme eller værktøjer. Datakvalitetsvurderingsplatforme kan hjælpe organisationer med at håndtere de voksende dataudfordringer, de står over for. 

Efterhånden som brugen af ​​cloud- og edge computing-tjenesterne udvides, kan organisationer bruge datakvalitetsvurderingsplatforme til at analysere, administrere og rense data hentet fra forskellige kilder såsom e-mail, sociale medier og tingenes internet. Nogle vurderingsplatforme (som inkluderer dashboards) diskuteres nedenfor.

TErwin Data Intelligence Platform bruger AI- og ML-aktiverede opdagelsesværktøjer til at opdage datamønstre og vil skabe forretningsregler for datakvalitetsvurderingen. Erwin Data Intelligence Platform automatiserer datakvalitetsvurderingen, giver løbende data observerbarhed og inkluderer detaljerede dashboards.

Acceldatas Enterprise Data Observability Platform integreres godt med forskellige teknologier og fungerer godt med offentlige, hybride og multi-cloud-miljøer. Det giver et yderst effektivt dashboard for datakvalitet og bruger automatiseringsalgoritmer til maskinlæring til at hjælpe med at maksimere dine datas effektivitet. Acceldatas platform vil opdage og rette problemer i begyndelsen af ​​datapipelinen og isolere dem, før de påvirker downstream-analyse.

IBM Infosphere Information Server for Data Quality Platform tilbyder en bred vifte af datakvalitetsværktøjer til at hjælpe med at analysere og overvåge datakvaliteten løbende. IBM platformen vil rense og standardisere data, mens datakvaliteten analyseres og overvåges for at reducere ukorrekte eller inkonsistente data.

Data Ladders DataMatch Enterprise har en fleksibel arkitektur, der giver en række værktøjer, der kan rense og standardisere data. Den kan integreres i de fleste systemer og er nem at bruge. DataMatch Enterprise er et selvbetjeningsværktøj til datakvalitet, der kan identificere grundlæggende anomalier. Den måler nøjagtighed, fuldstændighed, aktualitet osv. Den udfører også detaljeret datarensning, matchning og sammenlægning.

Intellectyx fungerer som entreprenør for en række datatjenester, herunder leverer datakvalitetsvurderinger og -løsninger. Deres proces indeholder:

  • Identificering af virksomhedens behov
  • Definition af datakvalitetsmålinger
  • Vurdere den aktuelle datakvalitet
  • Udvikling af en plan for forbedring

OpenRefine er ikke en datakvalitetsvurderingsplatform, men det er et gratis, kraftfuldt open source-værktøj designet til at arbejde med rodet data. Værktøjet vil rense dataene og omdanne dem til det passende format. Dataene renses på dit computersystem i stedet for en sky for datavask. 

Vurderingsrapporten

Datakvalitetsvurderingsrapporter er normalt designet til at beskrive resultaterne af vurderingen samt observationer og anbefalinger. Rapporten inkluderer alle uregelmæssigheder, der har haft en kritisk indvirkning på organisationen, samt løsninger til at identificere og eliminere disse uregelmæssigheder. 

Rapporten skal indeholde:

  • Resumé: En introduktion kombineret med en kort beskrivelse af rapporten
  • Nøgleresultater: Problemer med datastrømmen og hvordan de påvirker virksomheden
  • Den anvendte proces: Beskriv software og processen. (Hvis en entreprenør er blevet brugt, er rapporten deres ansvar)
  • Resultater og overordnede vurderinger (pr. udgave)
  • Anbefalinger (pr. udgave)
  • Åbne problemer: Eventuelle uløste problemer
  • En konklusion: De forventede resultater på virksomheden, når ændringerne foretages, og observationer eller råd vedrørende de uløste problemer

Billede brugt under licens fra Shutterstock.com

Tidsstempel:

Mere fra DATAVERSITET