Vă prezentăm Conceptul Data Analytics Fabric - DATAVERSITY

Vă prezentăm conceptul Data Analytics Fabric – DATAVERSITY

Nodul sursă: 2884345

Organizațiile din întreaga lume – atât profit, cât și nonprofit – caută să folosească analiza datelor pentru a îmbunătăți performanța afacerii. Constatări de la a Sondaj McKinsey indică faptul că organizațiile bazate pe date au de 23 de ori mai multe șanse de a achiziționa clienți, de șase ori mai multe șanse de a-și păstra clienții și de 19 ori mai profitabile [1]. Cercetare de către MIT a constatat că firmele mature digital sunt cu 26% mai profitabile decât colegii lor [2]. Dar multe companii, în ciuda faptului că sunt bogate în date, se luptă să implementeze analiza datelor din cauza priorităților conflictuale între nevoile afacerii, capabilitățile disponibile și resursele. Cercetare de către Gartner a constatat că peste 85% dintre proiectele de date și analize eșuează [3] și a raportul comun de la IBM și Carnegie Melon arată că 90% din datele dintr-o organizație nu sunt niciodată utilizate cu succes în niciun scop strategic [4].

În acest context, introducem conceptul de „testură de analiză a datelor (DAF)”, ca un ecosistem sau o structură care permite analizei datelor să funcționeze eficient pe baza (a) nevoilor sau obiectivelor afacerii, (b) capabilităților disponibile, cum ar fi oamenii/aptitudinile. , procese, cultură, tehnologii, perspective, competențe de luare a deciziilor și multe altele și (c) resurse (adică componentele de care o afacere are nevoie pentru a opera afacerea).

Scopul nostru principal de a introduce structura de analiză a datelor este de a răspunde la această întrebare fundamentală: „Ce este necesar pentru a construi eficient un sistem de decizie din Știința datelor algoritmi pentru măsurarea și îmbunătățirea performanței afacerii?” Fabrica de analiză a datelor și cele cinci manifestări cheie ale sale sunt prezentate și discutate mai jos.

Sursa imaginii: DBP-Institut

1. Concentrat pe măsurare

În esență, analiza se referă la utilizarea datelor pentru a obține informații, măsurarea și îmbunătățirea performanței afacerii [5]. Există trei tipuri principale de analize pentru a măsura și îmbunătăți performanța afacerii:

  • Analitică descriptivă pune întrebarea „Ce s-a întâmplat?” Analiza descriptivă este utilizată pentru a analiza datele istorice pentru a identifica modele, tendințe și relații folosind tehnici de analiză a datelor exploratorii, asociative și inferențiale. Tehnicile exploratorii de analiză a datelor analizează și rezumă seturi de date. Analiza descriptivă asociativă explică relația dintre variabile. Analiza inferențială a datelor descriptive este utilizată pentru a deduce sau a concluziona tendințe despre o populație mai mare pe baza setului de date eșantion. 
  • Analize predictive se uită să răspundă la întrebarea „Ce se va întâmpla?” Practic, analiza predictivă este procesul de utilizare a datelor pentru a prognoza tendințele și evenimentele viitoare. Analiza predictivă poate fi efectuată manual (cunoscută în mod obișnuit ca analiză predictivă condusă de analist) sau folosind algoritmi de învățare automată (cunoscut și ca analiză predictivă bazată pe date). Oricum, datele istorice sunt folosite pentru a face previziuni viitoare.
  • Analize prescriptive ajută la răspunsul la întrebarea „Cum putem face acest lucru să se întâmple?” Practic, analiza prescriptivă recomandă cel mai bun curs de acțiune pentru a merge mai departe folosind tehnici de optimizare și simulare. De obicei, analiza predictivă și analiza prescriptivă merg împreună, deoarece analiza predictivă ajută la găsirea de rezultate potențiale, în timp ce analiza prescriptivă analizează acele rezultate și găsește mai multe opțiuni.

2. Concentrat pe variabilă

Datele pot fi analizate și pe baza numărului de variabile disponibile. În acest sens, pe baza numărului de variabile, tehnicile de analiză a datelor pot fi univariate, bivariate sau multivariate.

  • Analiza univariată: Analiza univariată implică analiza modelului prezent într-o singură variabilă folosind măsuri de centralitate (medie, mediană, mod și așa mai departe) și variație (abatere standard, eroare standard, varianță și așa mai departe).
  • Analiza bivariata: Există două variabile în care analiza este legată de cauză și de relația dintre cele două variabile. Aceste două variabile pot fi dependente sau independente una de cealaltă. Tehnica corelației este cea mai utilizată tehnică de analiză bivariată.
  • Analiza multivariată: Această tehnică este utilizată pentru analiza a mai mult de două variabile. Într-un cadru multivariat, operăm de obicei în arena analiticii predictive și majoritatea algoritmilor de învățare automată (ML) bine-cunoscuți, cum ar fi regresia liniară, regresia logistică, arborii de regresie, mașinile vectoriale de suport și rețelele neuronale sunt de obicei aplicate unui multivariat. setare.

3. Concentrat pe supraveghere

Al treilea tip de fabrică de analiză a datelor se ocupă cu antrenarea datelor de intrare sau a datelor variabilelor independente care au fost etichetate pentru o anumită ieșire (adică, variabila dependentă). Practic, variabila independentă este cea pe care o controlează experimentatorul. Variabila dependentă este variabila care se modifică ca răspuns la variabila independentă. DAF-ul axat pe supraveghere ar putea fi unul dintre cele două tipuri.

  • Cauzalitate: Datele etichetate, indiferent dacă sunt generate automat sau manual, sunt esențiale pentru învățarea supravegheată. Datele etichetate permit definirea clară a unei variabile dependente, iar apoi este o chestiune a algoritmului de analiză predictivă să construiască un instrument AI/ML care să construiască o relație între etichetă (variabilă dependentă) și setul de variabile independente. Faptul că avem o demarcație distinctă între noțiunea de variabilă dependentă și un set de variabile independente, ne permitem să introducem termenul de „cauzalitate” pentru a explica cel mai bine relația.
  • Non-cauzalitate: Când indicăm „concentrat pe supraveghere” ca dimensiune a noastră, ne referim și la „absența supravegherii”, iar asta aduce în discuție modelele non-cauzale. Modelele non-cauzale merită menționate deoarece nu necesită date etichetate. Tehnica de bază aici este gruparea, iar cele mai populare metode sunt k-Means și Clustering ierarhic.  

4. Concentrat pe tipul de date

Această dimensiune sau manifestare a structurii de analiză a datelor se concentrează pe cele trei tipuri diferite de variabile de date legate atât de variabilele independente, cât și de cele dependente, care sunt utilizate în tehnicile de analiză a datelor pentru obținerea de informații. 

  • Date nominale este utilizat pentru etichetarea sau clasificarea datelor. Nu implică o valoare numerică și, prin urmare, nu sunt posibile calcule statistice cu date nominale. Exemple de date nominale sunt sexul, descrierea produsului, adresa clientului și altele asemenea. 
  • Date ordinale sau clasate este ordinea valorilor, dar diferențele dintre fiecare nu se cunosc cu adevărat. Exemple comune aici sunt clasarea companiilor pe baza capitalizării pieței, a termenilor de plată a furnizorilor, a scorurilor de satisfacție a clienților, a priorității de livrare și așa mai departe. 
  • Date numerice nu are nevoie de introducere și are valoare numerică. Aceste variabile sunt cele mai fundamentale tipuri de date care pot fi folosite pentru a modela toate tipurile de algoritmi.  

5. Concentrat pe rezultate

Acest tip de țesătură de analiză a datelor analizează modurile în care valoarea afacerii poate fi furnizată din informațiile derivate din analiză. Există două moduri în care valoarea afacerii poate fi condusă de analize și sunt prin produse sau proiecte. În timp ce produsele ar putea avea nevoie să abordeze ramificații suplimentare în ceea ce privește experiența utilizatorului și ingineria software, exercițiul de modelare efectuat pentru derivarea modelului va fi similar atât în ​​proiect, cât și în produs.

  • A produs de analiză a datelor este un activ de date reutilizabil pentru a satisface nevoile pe termen lung ale afacerii. Colectează date din surse de date relevante, asigură calitatea datelor, le prelucrează și le face accesibile oricui are nevoie de ele. Produsele sunt de obicei concepute pentru persoane și au mai multe etape ale ciclului de viață sau iterații la care se realizează valoarea produsului.
  • proiect de analiză a datelor este conceput pentru a răspunde unei nevoi specifice sau unice de afaceri și are o bază sau un scop definit sau restrâns de utilizatori. Practic, un proiect este un efort temporar menit să livreze soluția pentru un domeniu definit, în limitele bugetului și la timp.

Economia mondială se va transforma dramatic în următorii ani, deoarece organizațiile vor folosi din ce în ce mai mult datele și analizele pentru a obține informații și pentru a lua decizii pentru a măsura și îmbunătăți performanța afacerii. McKinsey a constatat că companiile care sunt bazate pe informații raportează creșteri ale EBITDA (câștigurile înainte de dobândă, impozite, depreciere și amortizare) de până la 25% [5]. Cu toate acestea, multe organizații nu reușesc să folosească date și analize pentru îmbunătățirea rezultatelor afacerii. Dar nu există o modalitate sau o abordare standard de a furniza analize de date. Implementarea sau implementarea soluțiilor de analiză a datelor depinde de obiectivele, capacitățile și resursele de afaceri. DAF și cele cinci manifestări ale sale discutate aici pot permite implementarea eficientă a analizelor în funcție de nevoile afacerii, capacitățile disponibile și resursele.

Referinte

  1. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/five-facts-how-customer-analytics-boosts-corporate-performance
  2. ide.mit.edu/insights/digitally-mature-firms-are-26-more-profitable-than-their-peers/
  3. gartner.com/en/newsroom/press-releases/2018-02-13-gartner-spune-nearly-half-of-cios-are-planning-to-deploy-artificial-intelligence
  4. forbes.com/sites/forbestechcouncil/2023/04/04/three-key-misconceptions-of-data-quality/?sh=58570fc66f98
  5. Southekal, Prashanth, „Cele mai bune practici de analiză”, Technics, 2020
  6. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/insights-to-impact-creating-and-sustaining-data-driven-commercial-growth

Timestamp-ul:

Mai mult de la VERSITATE DE DATE