Fyra perspektiv på konsten att analysera data - DATAVERSITET

Fyra perspektiv på konsten att analysera data – DATAVERSITET

Källnod: 3059543

Som proffs inom datavetenskap ses vi ofta som människor som drar slutsatser enbart baserat på data och minimerar andra faktorer. Denna uppfattning blir vanligtvis kontroversiell när insikterna och bevisen från data är oförenliga med någon annans "hypotes". Eller så är vi förvirrade och kanske frustrerade när "kvalitativ" analys övertrumfar kvantitativ analys. Nästa gång du känner denna frustration, överväg dessa fyra perspektiv på dataanalys för att validera och överväga andra synpunkter så att du kan försöka hitta en gemensam grund:  

1. "Outliers lika möjligheter."  

Outliers presenterar sig själva i en datauppsättning som anomalier. Kanske är extremvärden buller, men kanske är de speciella. 

Outliers kan vara unika insikter, nya trender eller intressanta segment. I medicinsk forskning kan en extremvärde peka på en sällsynt men livshotande biverkning av ett läkemedel. När det gäller kunddata kan en outlier vara en värdefull kundnisch som ännu inte har åtgärdats. Outliers kan vara en framväxande trend. Färgen rosa började som en outlier men blev snabbt det populäraste modevalet. 

Innan du avfärdar extremvärden som brus, använd dem för att väcka frågor och nyfikenhet:   

  • Pekar avvikelsen på en möjlighet?   
  • Varför finns extremvärdet?   
  • Om du kunde ändra tidsstämpeln för din datamängd, hur skulle det kunna påverka extremvärdena? 
  • Skulle du behöva anta om det finns fler extremvärden?  
  • Vad säger en outlier oss om systemet eller processen som analyseras?    
  • Vad skulle det krävas för att en outlier skulle bli en distinkt profil eller segment?  

Att förstå outliers kan leda till innovativ produktutveckling, identifiera nya marknadsmöjligheter och inse potentiella risker. Inom områden som miljövetenskap eller ekonomi kan extremvärden signalera viktiga mönsterförändringar, som plötsliga klimatförändringar eller finansiella kriser. Outliers har potentialen att förändra hur vi ser och tolkar data, och förändrar dem från missförstådda datapunkter till värdefulla pärlor av information. 

2. "En gång är en slump. Två gånger är en slump. Tre gånger är fiendens handling.” -Guld finger  

Har du någonsin undrat varför andra är bekväma med att göra "data driven” beslut med mycket begränsad information? Fler datapunkter ger oss alla mer självförtroende och högre precision, men ibland måste vi agera snabbt.  

Senast lanserade OpenAI ChatGPT trots dess brister, medan andra som hade liknande produkter väntade på att öka sitt förtroende för svarens noggrannhet. När du tror att någon fattar ett datadrivet beslut med låga konfidensnivåer och begränsad noggrannhet, överväg tidskostnaden. Fienden kanske skjuter. 

3. "Inte allt som räknas kan räknas, och inte allt som kan räknas räknas." – vanligen tillskriven Albert Einstein 

Med andra ord, "Jag uppskattar din dataanalys, men vad jag tycker eller hör är viktigare. Det går inte att räkna eller mäta.” 

Hur svarar du? Den här situationen är där du behöver bli kreativ.   

Till exempel kan kundbeteende, inklusive kundsentiment, varumärkeslojalitet och trender drivna av kulturella förändringar, vara immateriella och svåra att kvantifiera. Om du bara har onlinebeteendedata, använd andra metoder för att komma åt nya datakällor som testprogram, undersökningar, sociala sentimentanalyser, onlineetnografi eller grundläggande kundundersökningar.  

Kanske blir ingenting definitivt, men det är kombinationen och konsistensen av olika metoder och källor som pekar på en konsekvent slutsats.  

4. "Korrelation är lika med orsakssamband?"  

Att ersätta orsakssamband med korrelation kan leda till missriktat beslutsfattande när det görs utan medvetenhet. Det finns dock situationer där vi bara har tillgång till korrelationsdata. I dessa fall är det viktigt att undersöka om korrelationen bara är en tillfällighet eller om det finns en giltig bakomliggande orsak. 

Tänk till exempel på utmaningen att mäta marknadsföringskostnader och analysera försäljningsaktiviteter. Detta är komplexa uppgifter utan direkt orsakssamband. Man kan observera en stängningsgrad på 90 % när kunder besöker en leverantörs kontor för en kundbriefing, men det är viktigt att inte dra slutsatser och anta orsakssamband. Istället behövs ett mer nyanserat förhållningssätt.  

Vid närmare granskning blir det uppenbart att den höga stängningstakten inte är ett resultat av att man bara schemalägger kundgenomgångar för varje försäljningsinteraktion. Istället skapar själva interaktionerna lust hos klienterna att delta i dessa genomgångar, vilket sedan leder till en hög stängningstakt. Detta exempel illustrerar sammansmältningen av konst och vetenskap i analytics – en process som innebär att förstå den underliggande dynamiken och inte bara förlita sig på ytliga samband. 

Vi skulle alla vilja ha det statistiska förtroendet för massor av data med den idealiska datamängden. Verkligheten är att ibland måste vi vara kreativa och fantasifulla och undersöka extremvärden, korrelationer och alternativa datamängder. Eller ibland finns det ingen tid och du måste agera på begränsad data. 

Tidsstämpel:

Mer från DATAVERSITET