Vier perspectieven op de kunst van data-analyse - DATAVERSITY

Vier perspectieven op de kunst van data-analyse – DATAVERSITY

Bronknooppunt: 3059543

Als datawetenschappers worden we vaak gezien als mensen die conclusies trekken uitsluitend op basis van data en andere factoren bagatelliseren. Deze perceptie wordt meestal controversieel wanneer de inzichten en het bewijs uit de gegevens inconsistent zijn met de ‘hypothese’ van iemand anders. Of we zijn in de war en misschien zelfs gefrustreerd als ‘kwalitatieve’ analyse de kwantitatieve analyse overtroeft. De volgende keer dat u deze frustratie voelt, overweeg dan deze vier perspectieven op data-analyse om andere standpunten te valideren en te overwegen, zodat u kunt proberen een gemeenschappelijke basis te vinden:  

1. “Uitschieters gelijke kansen.”  

Uitschieters presenteren zich in een dataset als afwijkingen. Misschien zijn uitschieters ruis, maar misschien zijn ze speciaal. 

Uitschieters kunnen unieke inzichten, opkomende trends of interessante segmenten zijn. In medisch onderzoek kan een uitschieter wijzen op een zeldzame maar levensbedreigende bijwerking van een medicijn. In het geval van klantgegevens kan een uitbijter een waardevolle klantenniche zijn die nog niet is aangepakt. Uitschieters kunnen een opkomende trend zijn. De kleur roze begon als een uitschieter, maar werd al snel de populairste modekeuze. 

Voordat u uitschieters als ruis afdoet, kunt u ze gebruiken om vragen en nieuwsgierigheid op te wekken:   

  • Wijst de uitschieter op een kans?   
  • Waarom bestaat de uitbijter?   
  • Als u de tijdstempel van uw dataset zou kunnen wijzigen, welke invloed zou dat dan op de uitschieters kunnen hebben? 
  • Moet u ervan uitgaan dat er meer uitschieters zijn?  
  • Wat vertelt een uitbijter ons over het systeem of proces dat wordt geanalyseerd?    
  • Wat is er nodig voordat een uitbijter een duidelijk profiel of segment wordt?  

Het begrijpen van uitschieters kan leiden tot innovatieve productontwikkeling, het identificeren van nieuwe marktkansen en het onderkennen van potentiële risico’s. Op gebieden als de milieuwetenschappen of de economie kunnen uitschieters belangrijke patroonveranderingen signaleren, zoals plotselinge klimaatverschuivingen of financiële crises. Uitschieters hebben het potentieel om de manier waarop we gegevens bekijken en interpreteren te transformeren, waardoor ze van verkeerd begrepen datapunten veranderen in waardevolle informatiejuweeltjes. 

2. “Een keer is toeval. Twee keer is toeval. Drie keer is vijandelijke actie.” –Goudvinger  

Heb je je ooit afgevraagd waarom anderen het prettig vinden om “GegevensgestuurdeBeslissingen met zeer beperkte informatie? Meer datapunten geven ons allemaal meer vertrouwen en een grotere nauwkeurigheid, maar soms moeten we snel handelen.  

Recentelijk lanceerde OpenAI ChatGPT ondanks de tekortkomingen, terwijl anderen die soortgelijke producten hadden, wachtten om hun vertrouwen in de nauwkeurigheid van de reacties te vergroten. Als u denkt dat iemand een op gegevens gebaseerde beslissing neemt met een laag betrouwbaarheidsniveau en een beperkte nauwkeurigheid, houd dan rekening met de tijdskosten. Het kan zijn dat de vijand schiet. 

3. “Niet alles wat telt, kan geteld worden, en niet alles wat geteld kan worden, telt.” –algemeen toegeschreven aan Albert Einstein 

Met andere woorden: “Ik waardeer je data-analyse, maar wat ik denk of hoor is belangrijker. Het kan niet worden geteld of gemeten.” 

Hoe reageer je? In deze situatie moet je creatief zijn.   

Klantgedrag, inclusief klantsentiment, merkloyaliteit en trends die worden aangedreven door culturele verschuivingen, kunnen bijvoorbeeld ongrijpbaar en moeilijk te kwantificeren zijn. Als u alleen over onlinegedragsgegevens beschikt, gebruik dan andere methoden om toegang te krijgen tot nieuwe gegevensbronnen, zoals testprogramma's, enquêtes, analyse van sociaal sentiment, online etnografie of back-to-the-basics primair klantenonderzoek.  

Misschien zal niets definitief zijn, maar het is de combinatie en consistentie van verschillende methoden en bronnen die tot een consistente conclusie leiden.  

4. “Correlatie is gelijk aan oorzakelijk verband?”  

Het vervangen van causaliteit door correlatie kan leiden tot misleidende besluitvorming als dit zonder bewustzijn wordt gedaan. Er zijn echter situaties waarin we alleen toegang hebben tot correlatiegegevens. In deze gevallen is het van cruciaal belang om nauwkeurig te onderzoeken of de correlatie louter toeval is of dat er een geldige onderliggende oorzaak is. 

Denk bijvoorbeeld eens aan de uitdaging van het meten van de toeschrijving van marketinguitgaven en het analyseren van verkoopactiviteiten. Dit zijn complexe taken zonder direct causaal verband. Je zou een sluitingspercentage van 90% kunnen waarnemen wanneer klanten het kantoor van een leverancier bezoeken voor een klantbriefing, maar het is belangrijk om niet te snel conclusies te trekken en een oorzakelijk verband aan te nemen. In plaats daarvan is een meer genuanceerde aanpak nodig.  

Bij nader onderzoek wordt het duidelijk dat het hoge sluitingspercentage niet het gevolg is van het simpelweg plannen van klantbriefings voor elke verkoopinteractie. In plaats daarvan creëren de interacties zelf de wens bij klanten om deze briefings bij te wonen, wat vervolgens leidt tot een hoog sluitingspercentage. Dit voorbeeld illustreert de versmelting van kunst en wetenschap in analytics – een proces waarbij men de onderliggende dynamiek moet begrijpen en niet alleen moet vertrouwen op oppervlakkige correlaties. 

We willen allemaal de statistische betrouwbaarheid van veel gegevens met de ideale dataset. De realiteit is dat we soms creatief en fantasierijk moeten zijn en uitschieters, correlaties en alternatieve datasets moeten onderzoeken. Of soms is er geen tijd en moet u handelen op basis van beperkte gegevens. 

Tijdstempel:

Meer van DATAVERSITEIT