Predstavljamo koncept Data Analytics Fabric – DATAVERSITY

Predstavljamo koncept Data Analytics Fabric – DATAVERSITY

Izvorno vozlišče: 2884345

Organizacije po vsem svetu – tako profitne kot neprofitne – si prizadevajo izkoristiti analitiko podatkov za izboljšano poslovno uspešnost. Ugotovitve iz a Raziskava McKinsey kažejo, da je pri organizacijah, ki temeljijo na podatkih, 23-krat bolj verjetno, da bodo pridobile stranke, šestkrat bolj verjetno, da bodo stranke obdržale, in 19-krat bolj dobičkonosne [1]. Raziskava MIT ugotovili, da so digitalno zrela podjetja 26 % bolj dobičkonosna od podobnih [2]. Toda mnoga podjetja, kljub temu, da so bogata s podatki, težko izvajajo podatkovno analitiko zaradi nasprotujočih si prioritet med poslovnimi potrebami, razpoložljivimi zmogljivostmi in viri. Raziskava Gartnerja ugotovili, da več kot 85 % podatkovnih in analitičnih projektov ne uspe [3] in a skupno poročilo iz IBM-a in Carnegie Melon kaže, da 90 % podatkov v organizaciji ni nikoli uspešno uporabljenih za noben strateški namen [4].

S tem ozadjem uvajamo koncept »data analytics fabric (DAF)« kot ekosistem ali strukturo, ki omogoča učinkovito delovanje podatkovne analitike na podlagi (a) poslovnih potreb ali ciljev, (b) razpoložljivih zmogljivosti, kot so ljudje/veščine procese, kulturo, tehnologije, vpoglede, kompetence odločanja in drugo ter (c) vire (tj. komponente, ki jih podjetje potrebuje za delovanje).

Naš glavni cilj uvedbe strukture podatkovne analitike je odgovoriti na to temeljno vprašanje: »Kaj je potrebno za učinkovito izgradnjo sistema za odločanje iz Znanost podatki algoritmov za merjenje in izboljšanje poslovne uspešnosti?" Tkanina podatkovne analitike in njenih pet ključnih manifestacij je prikazanih in obravnavanih spodaj.

Vir slike: DBP-Inštitut

1. Osredotočeno na merjenje

Pri analitiki gre v bistvu za uporabo podatkov za pridobivanje meritev vpogledov in izboljšanje poslovne uspešnosti [5]. Obstajajo tri glavne vrste analitike za merjenje in izboljšanje poslovne uspešnosti:

  • Opisna analitika postavlja vprašanje: "Kaj se je zgodilo?" Deskriptivna analitika se uporablja za analizo zgodovinskih podatkov za prepoznavanje vzorcev, trendov in odnosov z uporabo raziskovalnih, asociativnih in inferenčnih tehnik analize podatkov. Raziskovalne tehnike analize podatkov analizirajo in povzemajo nize podatkov. Asociativna deskriptivna analiza pojasnjuje odnos med spremenljivkami. Inferencialna deskriptivna analiza podatkov se uporablja za sklepanje ali sklepanje trendov o večji populaciji na podlagi vzorčnega niza podatkov. 
  • Napovedna analitika gleda na odgovor na vprašanje: "Kaj se bo zgodilo?" V bistvu je napovedna analitika postopek uporabe podatkov za napovedovanje prihodnjih trendov in dogodkov. Napovedno analizo je mogoče izvesti ročno (splošno znano kot napovedna analitika, ki jo vodi analitik) ali z algoritmi strojnega učenja (znana tudi kot napovedna analitika na podlagi podatkov). V vsakem primeru se zgodovinski podatki uporabijo za napovedi prihodnosti.
  • Predpisovalna analitika pomaga odgovoriti na vprašanje: "Kako lahko to uresničimo?" V bistvu preskriptivna analitika priporoča najboljši način ukrepanja za napredovanje z uporabo optimizacijskih in simulacijskih tehnik. Običajno gresta napovedna analiza in predpisana analitika skupaj, ker prediktivna analitika pomaga najti možne rezultate, medtem ko predpisana analitika obravnava te izide in najde več možnosti.

2. Usmerjeno na spremenljivke

Podatke je mogoče analizirati tudi na podlagi števila razpoložljivih spremenljivk. V zvezi s tem so lahko tehnike podatkovne analitike univariatne, bivariatne ali multivariatne glede na število spremenljivk.

  • Univariatna analiza: Univariatna analiza vključuje analizo vzorca, ki je prisoten v eni sami spremenljivki, z uporabo mer osrednje vrednosti (povprečje, mediana, način itd.) in variacije (standardni odklon, standardna napaka, varianca itd.).
  • Bivariatna analiza: Obstajata dve spremenljivki, pri katerih je analiza povezana z vzrokom in razmerjem med obema spremenljivkama. Ti dve spremenljivki sta lahko odvisni ali neodvisni druga od druge. Korelacijska tehnika je najpogosteje uporabljena tehnika bivariatne analize.
  • Multivariatna analiza: Ta tehnika se uporablja za analizo več kot dveh spremenljivk. V multivariatni nastavitvi običajno delujemo v areni napovedne analitike in večina dobro znanih algoritmov strojnega učenja (ML), kot so linearna regresija, logistična regresija, regresijska drevesa, podporni vektorski stroji in nevronske mreže, se običajno uporablja za multivariatno nastavitev.

3. Osredotočeno na nadzor

Tretja vrsta strukture podatkovne analitike se ukvarja z usposabljanjem vhodnih podatkov ali neodvisnih spremenljivk, ki so bile označene za določen izhod (tj. odvisna spremenljivka). V bistvu je neodvisna spremenljivka tista, ki jo kontrolira eksperimentator. Odvisna spremenljivka je spremenljivka, ki se spreminja kot odziv na neodvisno spremenljivko. DAF, osredotočen na nadzor, je lahko ena od dveh vrst.

  • Vzročnost: Označeni podatki, ustvarjeni samodejno ali ročno, so bistveni za nadzorovano učenje. Označeni podatki omogočajo jasno definiranje odvisne spremenljivke, nato pa je stvar algoritma napovedne analitike, da zgradi orodje AI/ML, ki bi zgradilo razmerje med oznako (odvisno spremenljivko) in nizom neodvisnih spremenljivk. Dejstvo, da imamo jasno razmejitev med pojmom odvisne spremenljivke in množico neodvisnih spremenljivk, si dovolimo uvesti izraz "vzročnost", da bi najbolje pojasnili odnos.
  • Nevzročnost: Ko kot našo dimenzijo navedemo »osredotočenost na nadzor«, mislimo tudi na »odsotnost nadzora«, kar pripelje v razpravo nekavzalne modele. Nevzročni modeli si zaslužijo omembo, ker ne zahtevajo označenih podatkov. Osnovna tehnika tukaj je združevanje v gruče, najbolj priljubljeni metodi pa sta k-Means in hierarhično združevanje v gruče.  

4. Osredotočeno na vrsto podatkov

Ta razsežnost ali manifestacija strukture podatkovne analitike se osredotoča na tri različne vrste podatkovnih spremenljivk, povezanih z neodvisnimi in odvisnimi spremenljivkami, ki se uporabljajo v tehnikah podatkovne analitike za pridobivanje vpogledov. 

  • Nazivni podatki se uporablja za označevanje ali kategorizacijo podatkov. Ne vključuje numerične vrednosti, zato statistični izračuni z nominalnimi podatki niso mogoči. Primeri nominalnih podatkov so spol, opis izdelka, naslov stranke in podobno. 
  • Vrstni ali rangirani podatki je vrstni red vrednosti, vendar razlike med vsako posebej niso znane. Pogosti primeri tukaj so razvrščanje podjetij na podlagi tržne kapitalizacije, plačilnih pogojev prodajalca, rezultatov zadovoljstva strank, prednosti dostave itd. 
  • Številčni podatki ne potrebuje uvoda in ima številčno vrednost. Te spremenljivke so najbolj temeljni tipi podatkov, ki jih je mogoče uporabiti za modeliranje vseh vrst algoritmov.  

5. Osredotočenost na rezultate

Ta vrsta strukture podatkovne analitike preučuje načine, na katere je mogoče ustvariti poslovno vrednost iz vpogledov, pridobljenih iz analitike. Obstajata dva načina, na katera lahko analitika spodbuja poslovno vrednost, in to prek izdelkov ali projektov. Medtem ko bodo izdelki morda morali obravnavati dodatne posledice glede uporabniške izkušnje in programskega inženiringa, bo modeliranje, opravljeno za izpeljavo modela, podobno v projektu in izdelku.

  • A izdelek za analizo podatkov je podatkovno sredstvo za večkratno uporabo, ki služi dolgoročnim potrebam podjetja. Podatke zbira iz relevantnih podatkovnih virov, zagotavlja kakovost podatkov, jih obdeluje in omogoča dostop vsem, ki jih potrebujejo. Izdelki so običajno zasnovani za osebe in imajo več stopenj življenjskega cikla ali iteracij, na katerih se realizira vrednost izdelka.
  • projekt podatkovne analize je zasnovan tako, da obravnava določene ali edinstvene poslovne potrebe in ima opredeljeno ali ozko uporabniško bazo ali namen. V bistvu je projekt začasen podvig, katerega namen je zagotoviti rešitev za določen obseg, znotraj proračuna in pravočasno.

Svetovno gospodarstvo se bo v prihodnjih letih močno spremenilo, saj bodo organizacije vedno bolj uporabljale podatke in analitiko za pridobivanje vpogledov in sprejemanje odločitev za merjenje in izboljšanje poslovne uspešnosti. McKinsey ugotovili, da podjetja, ki temeljijo na vpogledu, poročajo o povečanju EBITDA (dobiček pred obrestmi, davki, amortizacijo) do 25 % [5]. Vendar številne organizacije niso uspešne pri izkoriščanju podatkov in analitike za izboljšanje poslovnih rezultatov. Vendar ni enega standardnega načina ali pristopa za zagotavljanje analitike podatkov. Uvedba ali implementacija rešitev podatkovne analitike je odvisna od poslovnih ciljev, zmogljivosti in virov. DAF in njegovih pet manifestacij, o katerih govorimo tukaj, lahko omogočijo učinkovito uvedbo analitike na podlagi poslovnih potreb, razpoložljivih zmogljivosti in virov.

Reference

  1. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/five-facts-how-customer-analytics-boosts-corporate-performance
  2. ide.mit.edu/insights/digitally-mature-firms-are-26-more-profitable-than-their-peers/
  3. gartner.com/en/newsroom/press-releases/2018-02-13-gartner-says-nearly-half-of-cios-are-planning-to-deploy-artificial-intelligence
  4. forbes.com/sites/forbestechcouncil/2023/04/04/three-key-misconceptions-of-data-quality/?sh=58570fc66f98
  5. Southekal, Prashanth, »Najboljše prakse analitike«, Technics, 2020
  6. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/insights-to-impact-creating-and-sustaining-data-driven-commercial-growth

Časovni žig:

Več od PODATKOVNOST