Evaluarea calității datelor: Măsurarea succesului - DATAVERSITY

Evaluarea calității datelor: Măsurarea succesului – DATAVERSITY

Nodul sursă: 2903188
evaluarea calității datelorevaluarea calității datelor

Scopul unei evaluări a calității datelor este nu numai de a identifica datele incorecte, ci și de a estima daunele aduse proceselor afacerii și de a implementa acțiuni corective. Multe companii mari se luptă să mențină calitatea datelor lor. 

Este important să rețineți că datele nu sunt întotdeauna stocate și statice, ci sunt utilizate periodic. După ce au fost create, datele sunt descărcate, ajustate, reformatate, schimbate și chiar distruse. 

Dacă este făcută incorect, fiecare acțiune vine cu amenințarea de a avea un impact negativ asupra calității datelor. La rândul său, calitatea slabă a datelor poate duce la blocaje și adesea afectează negativ deciziile pe care le ia o organizație. Fără sistemul de măsurare potrivit, este posibil ca datele de calitate scăzută să nu fie observate sau corectate niciodată.

Multe companii nu știu că au probleme legate de calitatea datelor. Evaluarea calității datelor este o parte mică, dar foarte importantă a maximizării eficienței unei afaceri. Problemele legate de calitatea datelor pot fi observate mai întâi de operațiunile de afaceri ale organizației sau de departamentul IT al acesteia. Pașii inițiali în realizarea unei evaluări a calității datelor pot fi considerați o „fază de conștientizare”. 

O evaluare a calității datelor sprijină dezvoltarea a strategie de date, iar o strategie de date bine organizată va alinia datele, susținând obiectivele, valorile și țintele companiei.

Profilarea datelor vs. evaluarea calității datelors

Profilarea datelor este adesea considerată un pas preliminar pentru efectuarea unei evaluări a calității datelor, în timp ce unii oameni cred că cele două ar trebui făcute simultan. Profilarea datelor se ocupă de înțelegerea structurii datelor, precum și a conținutului și a interrelațiilor acestora. O evaluare a calității datelor, pe de altă parte, evaluează și identifică problemele de date ale unei organizații și consecințele acestor probleme.

Valori utile de evaluare a calității datelor

Măsurile de evaluare a calității datelor măsoară, printre altele, cât de relevante, fiabile, exacte și coerente sunt datele unei organizații. În funcție de tipul de industrie și de obiectivele unei afaceri, pot fi necesare valori specifice pentru a determina dacă datele organizației îndeplinesc cerințele sale de calitate. Măsurarea calității datelor, înțelegerea modului în care sunt utilizate valorile datelor și a modului în care funcționează instrumentele și cele mai bune practici este un pas necesar pentru a deveni un Pe bază de date organizare. 

Valorile de bază privind calitatea datelor includ:

Relevanţă: Datele pot fi de înaltă calitate, dar inutile în ceea ce privește ajutarea organizației în îndeplinirea obiectivelor sale. De exemplu, o afacere axată pe vânzarea de cizme personalizate ar fi interesată de date utile de expediere, dar nu ar fi interesată de o listă de persoane care caută produse pentru repararea cizmelor. Stocarea datelor cu speranța vagă că vor fi relevante mai târziu este o greșeală comună. Metaplanul oferă software pentru măsurarea relevanței.  

Precizie: Adesea considerată cea mai importantă măsurătoare pentru calitatea datelor, acuratețea ar trebui măsurată prin documentarea sursei sau prin altă tehnică de confirmare independentă. Valoarea acurateței include și modificările de stare ale datelor, așa cum se întâmplă în timp real.

Punctualitate: Datele învechite variază de la inutile la potențial dăunătoare. De exemplu, datele de contact ale clienților care nu sunt niciodată actualizate vor dăuna campaniilor de marketing și publicității. Există, de asemenea, potențialul de a expedia produse la adresa veche, care nu mai este corectă. O afacere bună necesită ca toate datele să fie actualizate pentru procese de afaceri fluide și eficiente.

Exhaustivitate: Completitudinea datelor este în mod normal determinată prin decizia dacă fiecare dintre intrările de date este o intrare de date „completă”. Datele incomplete nu reușesc adesea să ofere informații utile despre afaceri. În multe situații, procesul de evaluare a completitudinii este o măsurare subiectivă făcută de un profesionist de date și nu de software pentru calitatea datelor.

Integritate: Integritatea datelor descrie acuratețea generală, consistența și caracterul complet al datelor de-a lungul întregului ciclu de viață. Integritatea datelor este, de asemenea, asociată cu siguranța datelor în ceea ce privește conformitatea cu reglementările privind confidențialitatea și securitatea personală.

Coerența: Versiuni diferite ale acelorași date pot face afaceri confuze. Datele și informațiile trebuie să fie consecvente în toate sistemele companiei pentru a evita confuzia. Din fericire, software-ul este disponibil, astfel încât fiecare versiune a datelor nu trebuie să fie comparată manual. (Date de bază și managementul acesteia este o opțiune pentru centralizarea datelor utilizate în mod repetitiv și evitarea versiunilor multiple.)

Pregătirea pentru evaluare 

O evaluare a calității datelor va evolua mai eficient și va oferi rezultate mai bune dacă este creată o listă de preocupări și obiective înainte de evaluare. Când creați această listă, fiți conștienți de obiectivele pe termen lung ale organizației, în timp ce enumerați obiectivele pe termen scurt. De exemplu, obiectivul pe termen lung de a eficientiza afacerea poate fi împărțit în obiective mai mici, cum ar fi repararea sistemului, astfel încât oamenii potriviți să primească facturile potrivite și ca toate adresele clienților să fie corecte etc. 

Această listă poate fi, de asemenea, prezentată unui consiliu de administrație ca motiv pentru inițierea și plata pentru software-ul de evaluare a calității datelor sau angajarea unui contractant pentru a efectua evaluarea. Pașii de bază pentru crearea listei sunt prezentați mai jos.

  • Începeți prin a face o listă cu problemele de calitate a datelor care au apărut în ultimul an.
  • Petreceți o săptămână sau două observând fluxul de date și stabiliți ce pare îndoielnic și de ce.
  • Împărtășiți-vă observațiile cu alți manageri și personal, obțineți feedback și ajustați rezultatele folosind feedback-ul.
  • Examinați lista cu probleme de calitate a datelor și determinați care sunt cele mai mari priorități, în funcție de modul în care acestea afectează veniturile.
  • Rescrieți lista, astfel încât prioritățile să fie listate mai întâi. (Această listă poate fi pusă la dispoziția consiliului de administrație și a contractorului de evaluare a calității datelor după ce domeniul de aplicare a fost stabilit.)
  • Stabiliți domeniul de aplicare – ce date vor fi analizate în timpul evaluării?
  • Determinați cine utilizează datele și examinați comportamentul lor de utilizare a datelor înainte și după evaluare pentru a determina dacă trebuie să facă modificări.

Platforme de evaluare a calității datelor

Efectuarea manuală a unei evaluări a calității datelor necesită atât de mult efort încât majoritatea managerilor nu ar fi aprobat-o niciodată. Din fericire, există platforme și soluții de calitate a datelor disponibile. Unii adoptă o abordare holistică, în timp ce alții se concentrează pe anumite platforme sau instrumente. Platformele de evaluare a calității datelor pot ajuta organizațiile să facă față provocărilor tot mai mari de date cu care se confruntă. 

Pe măsură ce utilizarea serviciilor cloud și edge computing se extinde, organizațiile pot folosi platforme de evaluare a calității datelor pentru a analiza, gestiona și curăța datele preluate din diferite surse, cum ar fi e-mailul, rețelele sociale și Internetul obiectelor. Unele platforme de evaluare (care includ tablouri de bord) sunt discutate mai jos.

TErwin Data Intelligence Platform folosește instrumente de descoperire activate AI și ML pentru a detecta tiparele de date și va crea reguli de afaceri pentru evaluarea calității datelor. Platforma Erwin Data Intelligence automatizează evaluarea calității datelor, oferă observabilitate continuă a datelor și include tablouri de bord detaliate.

Platforma de observabilitate a datelor pentru întreprinderi de la Acceldata se integrează bine cu diverse tehnologii și funcționează bine cu medii publice, hibride și multi-cloud. Oferă un tablou de bord foarte eficient pentru calitatea datelor și utilizează algoritmi de automatizare a învățării automate pentru a ajuta la maximizarea eficienței datelor dvs. Platforma Acceldata va detecta și corecta problemele la începutul conductei de date, izolându-le înainte ca acestea să afecteze analiza în aval.

IBM Infosphere Information Server for Data Quality Platform oferă o gamă largă de instrumente de calitate a datelor pentru a ajuta la analiza și monitorizarea continuă a calității datelor. Platforma IBM va curăța și standardiza datele în timp ce analizează și monitorizează calitatea datelor pentru a reduce datele incorecte sau inconsecvente.

DataMatch Enterprise de la Data Ladder are o arhitectură flexibilă care oferă o varietate de instrumente care pot curăța și standardiza datele. Poate fi integrat în majoritatea sistemelor și este ușor de utilizat. DataMatch Enterprise este un instrument de autoservire pentru calitatea datelor care poate identifica anomaliile de bază. Măsoară acuratețea, completitudinea, actualitatea etc. De asemenea, efectuează curățarea, potrivirea și îmbinarea detaliată a datelor.

Intellectyx acționează ca contractant pentru o varietate de servicii de date, inclusiv furnizarea de evaluări și soluții de calitate a datelor. Procesul lor cuprinde:

  • Identificarea nevoilor afacerii
  • Definirea valorilor de calitate a datelor
  • Evaluarea actuală a calității datelor
  • Elaborarea unui plan de îmbunătățire

OpenRefine nu este o platformă de evaluare a calității datelor, dar este un instrument gratuit, puternic și open source, conceput pentru a funcționa cu date dezordonate. Unealta va curăța datele, transformându-le în formatul corespunzător. Datele sunt curățate pe sistemul dvs. computer, mai degrabă decât pe un nor de spălare a datelor. 

Raportul de evaluare

Rapoartele de evaluare a calității datelor sunt în mod normal concepute pentru a descrie rezultatele evaluării, precum și observațiile și recomandările. Raportul include orice anomalii care au avut un impact critic asupra organizației, precum și soluții pentru identificarea și eliminarea acestor anomalii. 

Raportul ar trebui să includă:

  • Rezumat: o introducere combinată cu o scurtă descriere a raportului
  • Constatări cheie: probleme cu fluxul de date și modul în care acestea afectează afacerea
  • Procesul utilizat: Descrieți software-ul și procesul. (Dacă a fost folosit un antreprenor, raportul este responsabilitatea acestuia)
  • Scoruri și evaluări generale (pe număr)
  • Recomandări (pe număr)
  • Probleme deschise: orice problemă nerezolvată
  • O concluzie: Rezultatele așteptate asupra afacerii atunci când se fac modificările și observații sau sfaturi cu privire la problemele nerezolvate

Imagine utilizată sub licență de la Shutterstock.com

Timestamp-ul:

Mai mult de la VERSITATE DE DATE