Fire Perspectives on the Art of Data Analytics - DATAVERSITY

Fire perspektiver på kunsten at analysere data – DATAVERSITET

Kildeknude: 3059543

Som fagfolk i datavidenskab bliver vi ofte betragtet som mennesker, der kun drager konklusioner baseret på data og minimerer andre faktorer. Denne opfattelse bliver normalt omstridt, når indsigten og beviserne fra dataene er uforenelige med en andens "hypotese". Eller vi er forvirrede og måske frustrerede, når "kvalitativ" analyse overtrumfer kvantitativ analyse. Næste gang du føler denne frustration, så overvej disse fire perspektiver på dataanalyse for at validere og overveje andre synspunkter, så du kan prøve at finde fælles fodslag:  

1. "Outliers lige muligheder."  

Outliers præsenterer sig selv i et datasæt som anomalier. Måske er outliers støj, men måske er de specielle. 

Outliers kan være unik indsigt, nye tendenser eller interessante segmenter. I medicinsk forskning kunne en afviger pege på en sjælden, men livstruende bivirkning af en medicin. I tilfælde af kundedata kan en outlier være en værdifuld kundeniche, som endnu ikke er blevet behandlet. Outliers kan være en ny trend. Farven pink startede som en outlier, men blev hurtigt det mest populære modevalg. 

Før du afviser outliers som støj, skal du bruge dem til at vække spørgsmål og nysgerrighed:   

  • Peger udliggeren på en mulighed?   
  • Hvorfor eksisterer udliggeren?   
  • Hvis du kunne ændre tidsstemplet for dit datasæt, hvordan kunne det så påvirke outliers? 
  • Skal du antage, hvis der er flere afvigelser?  
  • Hvad fortæller en outlier os om systemet eller processen, der analyseres?    
  • Hvad skal der til for at en outlier bliver en særskilt profil eller et særskilt segment?  

At forstå outliers kan føre til innovativ produktudvikling, identificering af nye markedsmuligheder og genkendelse af potentielle risici. Inden for områder som miljøvidenskab eller økonomi kan outliers signalere vigtige mønsterændringer, såsom pludselige klimaændringer eller finansielle kriser. Outliers har potentialet til at transformere den måde, vi ser og fortolker data på, og ændre dem fra misforståede datapunkter til værdifulde perler af information. 

2. "En gang er tilfældigheder. To gange er en tilfældighed. Tre gange er fjendens handling." -Guld finger  

Har nogensinde undret dig over, hvorfor andre er trygge ved at lave "datastyret” beslutninger med meget begrænset information? Flere datapunkter giver os alle mere selvtillid og højere nøjagtighed, men nogle gange er vi nødt til at handle hurtigt.  

Senest lancerede OpenAI ChatGPT på trods af dets mangler, mens andre, der havde lignende produkter, ventede på at øge deres tillidsniveau for nøjagtigheden af ​​svar. Når du tror, ​​at nogen træffer en datadrevet beslutning med lave konfidensniveauer og begrænset nøjagtighed, så overvej tidsomkostningerne. Fjenden skyder måske. 

3. "Ikke alt, der tæller, kan tælles, og ikke alt, der kan tælles, tæller." – almindeligvis tilskrevet Albert Einstein 

Med andre ord: "Jeg sætter pris på din dataanalyse, men det, jeg tænker eller hører, er vigtigere. Det kan ikke tælles eller måles.” 

Hvordan reagerer du? Denne situation er, hvor du skal være kreativ.   

For eksempel kan kundeadfærd, herunder kundefølelse, brandloyalitet og tendenser drevet af kulturelle skift, være uhåndgribelige og svære at kvantificere. Hvis du kun har onlineadfærdsdata, skal du bruge andre metoder til at få adgang til nye datakilder, såsom testprogrammer, undersøgelser, analyse af sociale følelser, online-etnografi eller grundlæggende kundeundersøgelser.  

Måske vil intet være endegyldigt, men det er kombinationen og konsistensen af ​​forskellige metoder og kilder, der peger på en konsekvent konklusion.  

4. "Korrelation er lig med årsagssammenhæng?"  

At erstatte sammenhæng med årsagssammenhæng kan føre til misforstået beslutningstagning, når det gøres uden bevidsthed. Der er dog situationer, hvor vi kun har adgang til korrelationsdata. I disse tilfælde er det afgørende at undersøge, om sammenhængen blot er en tilfældighed, eller om der er en gyldig underliggende årsag. 

Overvej for eksempel udfordringen med at måle tilskrivning af marketingudgifter og analysere salgsaktiviteter. Det er komplekse opgaver uden direkte årsagssammenhæng. Man kan måske observere en lukkeprocent på 90%, når kunder besøger en leverandørs kontor til en kundebriefing, men det er vigtigt ikke at drage forhastede konklusioner og antage årsagssammenhæng. I stedet er der brug for en mere nuanceret tilgang.  

Ved nærmere undersøgelse bliver det tydeligt, at den høje lukkerate ikke er et resultat af blot at planlægge kundebriefinger for hver salgsinteraktion. I stedet skaber interaktionerne i sig selv lysten hos klienterne til at deltage i disse briefinger, hvilket efterfølgende fører til en høj lukkerate. Dette eksempel illustrerer fusionen af ​​kunst og videnskab i analytics – en proces, der involverer at forstå den underliggende dynamik og ikke kun stole på overfladiske sammenhænge. 

Vi vil alle gerne have den statistiske sikkerhed for masser af data med det ideelle datasæt. Virkeligheden er, at vi nogle gange skal være kreative og fantasifulde og undersøge outliers, sammenhænge og alternative datasæt. Eller nogle gange er der ingen tid, og du skal handle på begrænsede data. 

Tidsstempel:

Mere fra DATAVERSITET