Vad är dataprodukter och varför spelar de roll? - DATAVERSITET

Vad är dataprodukter och varför spelar de roll? – DATAVERSITET

Källnod: 3037494

Dataprodukter är mjukvara i form av specialverktyg och appar som är designade för att stödja data som används som en tjänst. De kan vara lika enkla och okomplicerade som ett program som omvandlar en datauppsättning till en visualisering, eller lika komplexa som ett maskininlärningssystem baserat på stora språkmodeller (LLM), som t.ex. ChatGPT. Gemensamt för alla dataprodukter är att de uppnår ett specifikt mål genom tillämpning av data.

En potentiellt förvirrande aspekt av tekniken är skillnaden mellan dataprodukter och "data som en produkt,” som slår samman dataverktyg med strategier för att möta behoven hos specifika datakonsumenter, oavsett om det är en person eller en hel avdelning eller organisation. Däremot fungerar dataprodukter som råvaran som företag kan kombinera på unika sätt för att implementera strategier för att uppnå sina kortsiktiga och långsiktiga mål. De verkar på nivån för individer, team, avdelningar, företag och hela branscher.

Vad är en Dataprodukt?

AI och andra växande teknologier tillåter organisationer att få insikter från sina datatillgångar på ett sätt som maximerar datavärdet. Dataprodukter fungerar som det sätt på vilket företag omvandlar data till åtgärder som förbättrar deras effektivitet, konkurrenskraft och lönsamhet. Tidigare amerikansk dataforskare DJ Patil myntade termen "data jujitsu" 2012 som "konsten att förvandla data till produkt." 

Genom den smarta tillämpningen av dataelement tillåter datajujitsu att annars svårlösta iterativa dataproblem kan lösas genom att använda problemets "tyngd" mot sig själv, precis som jujitsu-kombattanter försöker använda sina motståndares vikt till sin fördel och sina fienders nackdel . Den vanliga problemlösningsmetoden att attackera det direkt med hjälp av olika tekniska expertis komplicerar ofta problemet och gör det svårare att lösa.

Målet med dataprodukter är att förenkla problemlösning genom att ta upp en enkel fråga från början: Vem vill ha eller behöver den här produkten? För att snabbt besvara denna fråga tar utvecklare genvägar som kan komma till den färdiga versionen, eller ersättas av mer komplicerade tillvägagångssätt senare i processen. Nyckeln är att börja enkelt, för att undvika att bli fast i början av projektet.

Komponenter i dataprodukter

Även de enklaste dataprodukterna består av en mångsidig lista med element som kombineras för att stödja beslut och lösa affärsproblem. Dessa är åtta nyckelkomponenter av en dataprodukt:

  • Datakällor måste vara tillförlitlig, tillgänglig i realtid eller i partier, relevant för det problem som ska lösas, och i enlighet med dataskyddsbestämmelser som t.ex. GDPR och HIPAA, såväl som med juridiska och etiska standarder.
  • Datapipelines automatisera alla nödvändiga datakonverteringar (ETL, till exempel), skalas för att rymma växande datauppsättningar, inkluderar robusta felhanteringsverktyg och datakvalitetskontroller och är modulära för att stödja konfigurationsändringar.
  • Datalagring måste uppfylla prestandakrav, skala horisontellt och vertikalt utan störningar, tillämpa kryptering och åtkomstkontroller och vara kostnadseffektiv samtidigt som den stödjer strukturerade, semistrukturerade och ostrukturerade datatyper.
  • Datamodeller och algoritmer ge korrekta insikter och förutsägelser som har validerats med hjälp av tekniker som korsvalidering. De måste vara lätta för intressenter att förstå, beräkningseffektiva och lätta att underhålla.
  • Smakämnen användargränssnitt bör vara tillräckligt intuitivt för att kräva minimal användarutbildning. Den bör använda sig av visualiseringar och underlätta användarnas interaktion med data, inklusive återkopplingsmekanismer och stöd för flera enheter.
  • API:er och slutpunkter kräver säker auktorisering och autentisering, gränser för antalet API-anrop från varje användare eller system och tillräcklig utvecklardokumentation. De ska stödja dataformat som t.ex JSON och XML för att säkerställa kompatibilitet.
  • Övervakning och loggning i realtid gör det möjligt för dataprodukter att snabbt identifiera och åtgärda problem. Administratörer uppmärksammas på prestandaproblem och fel, och revisionsspår hjälper företag att uppfylla efterlevnadskrav. Prestandamått som ska övervakas inkluderar latens, genomströmning och felfrekvenser.
  • Dokumentation innehåller användarmanualer, tekniska specifikationer, dokumentation för API:er, ändringsloggar och efterlevnadsposter.

Exempel på dataprodukter

Det mest populära exemplet på en dataprodukt kan vara ChatGPT, det kostnadsfria AI-baserade verktyget som svarar på enkla och komplexa frågor på ett konversationssätt och går in i en dialog med användare som tillåter uppföljningsfrågor, erkänner sina misstag och utmanar felaktigheter. ChatGPT kvalificerar sig som en dataprodukt eftersom det beror på en mycket stor textdatauppsättning, även om systemet är mycket mer komplext än vanliga dataprodukter. 

Men i sitt nuvarande tillstånd saknar ChatGPT en viktig aspekt av dataprodukter: noggrannhet. Dataproduktens ägare är ansvarig för att säkerställa både en positiv användarupplevelse och en tillförlitlig lösning på problemet som produkten utformades för att hjälpa till att åtgärda. Detta kräver bästa praxis inom produkthantering och konsekvent och pålitlig tillgång till analyser som stödjer affärsbeslut.

Dessa sex kategorier av dataprodukter demonstrera användningen av tekniken i vardagsprodukter:

  • Rekommendationsmotorer som erbjuds av företag som Amazon, Netflix och TripAdvisor anpassar sina svar för att öka kundernas engagemang och förbättra konverteringsfrekvensen.
  • Förutsägande analysverktyg inkluderar de som används av FICO, LinkedIn och Zillow som identifierar trender i data och genererar prognoser baserade på avancerad datautvinning och modelleringsteknik.
  • Data API:er som Google Maps, LinkedIn Profiles och IO Weather underlättar ett smidigt dataflöde mellan olika system. Vanliga format är representational state transfer (REST), Simple Object Access Protocol (SOAP), XML-RPC och JSON-RPC.
  • Instrumentpaneler i realtid presentera data visuellt och uppdatera användarnas skärmar automatiskt när ny information blir tillgänglig. De används för att övervaka lager-, försäljnings- och driftsdata som stöd för affärsbeslut. Populära instrumentpaneler inkluderar Tableau, Microsoft BI och Zoho Analytics.
  • Privatekonomi verktyg innefattar Empower (tidigare Personal Capital), Quicken och You Need a Budget (YNAB), som alla försöker skapa mer klarhet och förtroende för individers ekonomiska planering.
  • Bärbara hälsoövervakningsprodukter som Apple Watch, FitBit och Dexcoms kontinuerliga glukosmätare går längre än att spåra pulsfrekvenser, sömnmönster och andra hälsofrågor genom att dela informationen med vårdgivare.

Varför dataprodukter är viktiga

Dataprodukter gagnar datakonsumenter på flera sätt:

  • De får insikter snabbare genom att använda förbyggda produkter istället för att behöva starta varje projekt från början.
  • Dataintegriteten verifieras i förväg, så förtroende är inbyggt i produkterna.
  • Situationsmedvetenhet i realtid ökar värdet av dataanalyser.
  • Möjligheten att svara i realtid stödjer snabbare informerat beslutsfattande.
  • Styrningen underlättas av förhandsgarantier för Datakvalitet och överensstämmelse.
  • Produkterna gör data lätt att hitta och komma åt från olika system.

Organisationer ser dataprodukter som nyckeln till ökad effektivitet och lönsamhet:

  • Dataprodukter hjälper till att skärpa företagets fokus på positiva resultat.
  • De förbättrar organisationers smidighet och levererar värde stegvis.
  • Återanvändning av dataprodukter maximerar värdet av data med mycket lite omkostnader.
  • Dataarkitekturer görs framtidssäkra genom anpassningsförmågan hos dataprodukter.
  • Färre frågor uppstår om tillförlitligheten och integriteten hos de underliggande data.
  • Affärs- och IT-avdelningar kommunicerar på samma språk.

Den kanske största fördelen med dataprodukter för organisationer är deras förmåga att låsa upp datavärdet genom att fungera som limmet som binder samman fysiska system, datamodellering och affärsprocesser och användningsfall. De ersätter det bitvisa tillvägagångssätt som många företag tar till sin dataverksamhet samtidigt som de decentraliserar Data Management. Detta frigör de underliggande data som kan användas direkt i olika situationer och förhållanden, med minimal eller ingen förbearbetning. 

Enligt McKinsey tillåter dataprodukter nya affärsanvändningsfall att vara implementeras 90 % snabbare och den totala ägandekostnaden att minska med 30 %. De minskar också risken och den tid och pengar som läggs på styrning.

Att förverkliga fördelarna som utlovas av dataprodukter kräver att man antar en agilt förhållningssätt till datahantering som börjar smått, släpps snabbt, upprepas och visar produkternas värde. Lägg till några fler funktioner med varje utgåva för att öka produktens värde stegvis för att stimulera adoption och få ökade investeringar för nya produkter och användningsfall. När dataprodukter integreras med ditt företags vardagliga affärsprocesser kommer verktygen att börja sälja sig själva när deras värde blir uppenbart för användare och chefer. 

Bild använd under licens från Shutterstock

Tidsstämpel:

Mer från DATAVERSITET