Kaj so podatkovni izdelki in zakaj so pomembni? - DATAVERSITY

Kaj so podatkovni izdelki in zakaj so pomembni? – DATAVERSION

Izvorno vozlišče: 3037494

Podatkovni izdelki so programska oprema v obliki posebnih orodij in aplikacij, ki so zasnovane za podporo podatkov, ki se uporabljajo kot storitev. Lahko so preprosti in enostavni kot program, ki nabor podatkov pretvori v vizualizacijo, ali tako zapleteni kot sistem strojnega učenja, ki temelji na velikih jezikovnih modelih (LLM), kot je npr. ChatGPT. Vsem podatkovnim produktom je skupno to, da z uporabo podatkov dosegajo določen cilj.

Eden od vidikov tehnologije, ki bi lahko povzročil zmedo, je razlikovanje med podatkovnimi izdelki in »podatki kot izdelek,« ki združuje podatkovna orodja s strategijami za izpolnjevanje potreb določenih uporabnikov podatkov, bodisi ene osebe bodisi celotnega oddelka ali organizacije. Nasprotno pa podatkovni izdelki služijo kot surovina, ki jo lahko podjetja kombinirajo na edinstvene načine za izvajanje strategij za doseganje svojih kratkoročnih in dolgoročnih ciljev. Delujejo na ravni posameznikov, skupin, oddelkov, podjetij in celotnih industrij.

Kaj je a Podatkovni izdelek?

Umetna inteligenca in druge hitro rastoče tehnologije omogočajo organizacijam, da pridobijo vpoglede iz svojih podatkovnih sredstev na načine, ki povečajo vrednost podatkov. Podatkovni izdelki služijo kot sredstvo, s katerim podjetja pretvorijo podatke v dejanja, ki izboljšujejo njihovo učinkovitost, konkurenčnost in donosnost. Nekdanji glavni ameriški podatkovni znanstvenik DJ Patil skoval izraz "podatkovni jujitsu« leta 2012 kot »umetnost pretvarjanja podatkov v izdelek«. 

S pametno uporabo podatkovnih elementov podatkovni jujitsu omogoča reševanje sicer nerešljivih iterativnih podatkovnih problemov z uporabo "teže" problema proti sebi, tako kot poskušajo jujitsu borci uporabiti težo svojih nasprotnikov v svojo korist in v škodo svojih sovražnikov . Standardni pristop k reševanju problemov, ki ga neposredno napada z uporabo različnih tehničnih izkušenj, pogosto zaplete problem in oteži njegovo rešitev.

Cilj podatkovnih izdelkov je poenostaviti reševanje problemov z naslovom preprostega vprašanja na začetku: Kdo želi ali potrebuje ta izdelek? Da bi hitro odgovorili na to vprašanje, razvijalci uporabijo bližnjice, ki lahko pridejo do končne različice ali pa jih kasneje v procesu nadomestijo bolj zapleteni pristopi. Ključno je preprosto začeti, da se izognete zapletom na začetku projekta.

Komponente podatkovnih izdelkov

Tudi najpreprostejši podatkovni izdelki so sestavljeni iz raznolikega seznama elementov, ki se združujejo v podporo odločitvam in reševanju poslovnih težav. To so osem ključnih komponent podatkovnega izdelka:

  • Viri podatkov mora biti zanesljiv, dostopen v realnem času ali v paketih, relevanten za problem, ki ga rešujemo, in v skladu s predpisi o varstvu podatkov, kot je npr. GDPR in HIPAA, kot tudi s pravnimi in etičnimi standardi.
  • Podatkovni cevovodi avtomatizirajte morebitne potrebne pretvorbe podatkov (ETL, na primer), se prilagodijo za prilagajanje naraščajočim naborom podatkov, vključujejo robustna orodja za obravnavanje napak in preverjanja kakovosti podatkov ter so modularni za podporo spremembam konfiguracije.
  • shranjevanje podatkov izpolnjevati mora zahteve glede zmogljivosti, vodoravno in navpično skaliranje brez motenj, uporabljati šifriranje in nadzor dostopa ter biti stroškovno učinkovit ob podpiranju strukturiranih, polstrukturiranih in nestrukturiranih tipov podatkov.
  • Podatkovni modeli in algoritmi zagotoviti natančne vpoglede in napovedi, ki so bile potrjene s tehnikami, kot je navzkrižna validacija. Biti morajo enostavni za razumevanje zainteresiranih strani, računsko učinkoviti in enostavni za vzdrževanje.
  • Uporabniški vmesnik mora biti dovolj intuitiven, da zahteva minimalno uporabniško usposabljanje. Uporabljati mora vizualizacije in olajšati interakcijo uporabnikov s podatki, vključno s povratnimi mehanizmi in podporo za več naprav.
  • API-ji in končne točke zahtevajo varno avtorizacijo in avtentikacijo, omejitve števila klicev API-ja od vsakega uporabnika ali sistema ter zadostno dokumentacijo razvijalca. Podpirati morajo formate podatkov, kot je npr JSON in XML da zagotovite združljivost.
  • Spremljanje in beleženje v realnem času omogoča podatkovnim izdelkom hitro prepoznavanje in reševanje težav. Skrbniki so opozorjeni na težave z delovanjem in napake, revizijske sledi pa pomagajo podjetjem pri izpolnjevanju zahtev skladnosti. Meritve delovanja, ki jih je treba spremljati, vključujejo zakasnitev, prepustnost in stopnje napak.
  • dokumentacija vključuje uporabniške priročnike, tehnične specifikacije, dokumentacijo za API-je, dnevnike sprememb in zapise skladnosti.

Primeri podatkovnih izdelkov

Najbolj priljubljen primer podatkovnega izdelka je morda ChatGPT, brezplačno orodje, ki temelji na umetni inteligenci in odgovarja na preprosta in zapletena vprašanja v pogovoru in vstopa v dialog z uporabniki, ki omogoča nadaljnja vprašanja, priznava svoje napake in izpodbija netočnosti. ChatGPT se kvalificira kot podatkovni izdelek, ker je odvisen od a zelo velik nabor besedilnih podatkov, čeprav je sistem veliko bolj zapleten kot običajni podatkovni izdelki. 

Vendar v trenutnem stanju ChatGPT nima enega pomembnega vidika podatkovnih izdelkov: natančnosti. Lastnik podatkovnega izdelka je odgovoren za zagotavljanje pozitivne uporabniške izkušnje in zanesljive rešitve težave, za katero je bil izdelek zasnovan, da pomaga odpraviti. To zahteva najboljše prakse pri upravljanju izdelkov ter dosleden in zanesljiv dostop do analiz, ki podpirajo poslovne odločitve.

te šest kategorij podatkovnih izdelkov prikazati uporabo tehnologije v vsakodnevnih izdelkih:

  • Priporočila motorjev ki jih ponujajo podjetja, kot so Amazon, Netflix in TripAdvisor, prilagodijo svoje odzive, da povečajo sodelovanje strank in izboljšajo stopnje konverzije.
  • Orodja za napovedno analitiko vključujejo tiste, ki jih uporabljajo FICO, LinkedIn in Zillow, ki prepoznavajo trende v podatkih in ustvarjajo napovedi na podlagi naprednih tehnik podatkovnega rudarjenja in modeliranja.
  • Podatkovni API-ji kot so Google Maps, LinkedIn Profiles in IO Weather, olajšajo nemoten pretok podatkov med različnimi sistemi. Pogosti formati so reprezentativni prenos stanja (REST), preprosti protokol za dostop do objektov (SOAP), XML-RPC in JSON-RPC.
  • Nadzorne plošče v realnem času predstavi podatke vizualno in samodejno posodablja zaslone uporabnikov, ko so na voljo nove informacije. Uporabljajo se za spremljanje zalog, prodaje in operativnih podatkov v podporo poslovnim odločitvam. Priljubljene nadzorne plošče vključujejo Tableau, Microsoft BI in Zoho Analytics.
  • Osebne finance orodja vključujejo Empower (prej Personal Capital), Quicken in You Need a Budget (YNAB), ki poskušajo vnesti več jasnosti in zaupanja v finančno načrtovanje posameznikov.
  • Nosljivi izdelki za spremljanje zdravja kot so Apple Watch, FitBit in Dexcom's Continuous Glucose Meter, presegajo sledenje utripom, vzorcem spanja in drugim zdravstvenim zadevam z deljenjem informacij s ponudniki zdravstvenih storitev.

Zakaj so podatkovni izdelki pomembni

Podatkovni izdelki potrošnikom podatkov na več načinov:

  • Hitreje pridobijo vpogled z uporabo vnaprej pripravljenih izdelkov, namesto da bi morali vsak projekt začeti iz nič.
  • Celovitost podatkov je predhodno preverjena, zato je v izdelke vgrajeno zaupanje.
  • Zavedanje situacije v realnem času povečuje vrednost analiz podatkov.
  • Sposobnost odzivanja v realnem času podpira hitrejše informirano odločanje.
  • Upravljanje je olajšano z vnaprejšnjimi garancijami Kakovost podatkov in skladnost.
  • Izdelki olajšajo iskanje in dostop do podatkov iz različnih sistemov.

Organizacije vidijo podatkovne izdelke kot ključ do večje učinkovitosti in donosnosti:

  • Podatkovni izdelki pomagajo povečati osredotočenost podjetja na pozitivne rezultate.
  • Izboljšajo agilnost organizacij in postopno zagotavljajo vrednost.
  • Ponovna uporaba podatkovnih izdelkov poveča vrednost podatkov z zelo malo stroškov.
  • Podatkovne arhitekture so zaradi prilagodljivosti podatkovnih izdelkov pripravljene na prihodnost.
  • Pojavlja se manj vprašanj o verodostojnosti in celovitosti osnovnih podatkov.
  • Poslovni in IT oddelki komunicirajo v istem jeziku.

Morda je največja prednost podatkovnih izdelkov za organizacije njihova sposobnost, da odkleni vrednost podatkov tako da služi kot lepilo, ki povezuje fizične sisteme, modeliranje podatkov ter poslovne procese in primere uporabe. Nadomeščajo delni pristop, ki ga mnoga podjetja uporabljajo za svoje podatkovne operacije, hkrati pa decentralizirajo upravljanje podatkov. To osvobodi temeljne podatke, ki jih je mogoče uporabiti sproti v različnih situacijah in pogojih, z minimalno predhodno obdelavo ali brez nje. 

Po mnenju McKinseyja podatkovni izdelki omogočajo nove poslovne primere uporabe izvajati 90 % hitreje skupni stroški lastništva pa se bodo znižali za 30 %. Prav tako zmanjšajo tveganje ter čas in denar, porabljen za operacije upravljanja.

Uresničitev prednosti, ki jih obljubljajo podatkovni izdelki, zahteva sprejetje agilen pristop k upravljanju podatkov ki se začne z majhnim, hitro sprosti, ponavlja in dokazuje vrednost izdelkov. Z vsako izdajo dodajte še nekaj zmogljivosti, da postopoma povečate vrednost izdelka, da spodbudite sprejemanje in povečate naložbe v nove izdelke in primere uporabe. Ko bodo podatkovni izdelki integrirani v vsakodnevne poslovne procese vašega podjetja, se bodo orodja začela prodajati sama od sebe, ko bo njihova vrednost postala očitna uporabnikom in menedžerjem. 

Slika, uporabljena pod licenco Shutterstock

Časovni žig:

Več od PODATKOVNOST