Négy perspektíva az adatelemzés művészetéről – DATAVERSITY

Négy perspektíva az adatelemzés művészetéről – DATAVERSITY

Forrás csomópont: 3059543

Adattudományi szakemberekként gyakran úgy tekintenek ránk, mint akik csak adatok alapján vonnak le következtetéseket, és minimalizálják az egyéb tényezőket. Ez a felfogás általában akkor válik vitássá, ha az adatokból származó meglátások és bizonyítékok nem állnak összhangban valaki más „hipotézisével”. Vagy összezavarodunk és talán frusztrált is vagyunk, amikor a „minőségi” elemzés megelőzi a kvantitatív elemzést. Amikor legközelebb ezt a frusztrációt érzi, fontolja meg az adatelemzés alábbi négy szempontját, hogy érvényesítsen és fontoljon meg más nézeteket, hogy megpróbálja megtalálni a közös hangot:  

1. „A kiugró esélyegyenlőség.”  

A kiugró értékek anomáliákként jelennek meg az adatkészletben. Lehet, hogy a kiugró értékek zajok, de talán különlegesek. 

A kiugró értékek lehetnek egyedi meglátások, feltörekvő trendek vagy érdekes szegmensek. Az orvosi kutatásban a kiugró érték a gyógyszer ritka, de életveszélyes mellékhatására utalhat. Az ügyféladatok esetében a kiugró érték egy olyan értékes ügyfélrés lehet, amellyel még nem foglalkoztak. A kiugró értékek feltörekvő trend lehet. A rózsaszín szín kiugrónak indult, de gyorsan a legnépszerűbb divatválasztássá vált. 

Mielőtt elvetné a kiugró értékeket zajként, használja őket kérdések és kíváncsiság felkeltésére:   

  • A kiugró érték egy lehetőségre mutat?   
  • Miért létezik a kiugró érték?   
  • Ha módosíthatja az adatkészlet időbélyegét, az hogyan befolyásolná a kiugró értékeket? 
  • Fel kell tételeznie, ha több a kiugró érték?  
  • Mit árul el egy kiugró érték az elemzett rendszerről vagy folyamatról?    
  • Mi kell ahhoz, hogy egy kiugró érték külön profillá vagy szegmenssé váljon?  

A kiugró értékek megértése innovatív termékfejlesztéshez, új piaci lehetőségek azonosításához és a lehetséges kockázatok felismeréséhez vezethet. Az olyan területeken, mint a környezettudomány vagy a közgazdaságtan, a kiugró értékek fontos mintaváltozásokat jelezhetnek, például hirtelen klímaváltozásokat vagy pénzügyi válságokat. A kiugró értékek megváltoztathatják az adatok megtekintésének és értelmezésének módját, és félreértett adatpontokból értékes információgyöngyszemekké változtathatják azokat. 

2. „Egyszer a véletlen. A kétszer véletlen egybeesés. Háromszor ellenséges akció." -Arany ujj  

Gondolkoztál már azon, hogy mások miért érzik jól magukatadatalapú” döntéseket nagyon korlátozott információval? A több adatpont nagyobb magabiztosságot és nagyobb pontosságot ad nekünk, de néha gyorsan kell cselekednünk.  

Legutóbb az OpenAI hibái ellenére elindította a ChatGPT-t, míg mások, akik hasonló termékkel rendelkeztek, arra vártak, hogy növeljék bizalmukat a válaszok pontosságában. Ha úgy gondolja, hogy valaki alacsony megbízhatósági szinttel és korlátozott pontossággal adatvezérelt döntést hoz, vegye figyelembe az időköltséget. Lehet, hogy az ellenség lő. 

3. "Nem mindent lehet megszámolni, ami számít, és nem minden számít, amit meg lehet számolni." – Általában Albert Einsteinnek tulajdonítják 

Más szavakkal: „Nagyra értékelem az adatelemzésedet, de az, amit gondolok vagy hallok, sokkal fontosabb. Nem lehet megszámolni vagy mérni.” 

Hogyan reagálsz? Ebben a helyzetben kreatívnak kell lennie.   

Például a vásárlói magatartás, beleértve a vásárlói hangulatot, a márkahűséget és a kulturális változások által vezérelt trendeket, megfoghatatlan és nehezen számszerűsíthető. Ha csak online viselkedési adataival rendelkezik, használjon más módszereket az új adatforrások elérésére, például tesztprogramokat, felméréseket, társadalmi hangulatelemzést, online etnográfiát vagy vissza az alapokhoz való elsődleges ügyfélkutatást.  

Talán semmi sem lesz végleges, de a különböző módszerek és források kombinációja és konzisztenciája az, amely következetes következtetésre mutat.  

4. "A korreláció egyenlő az oksággal?"  

Az ok-okozati összefüggés korrelációjának helyettesítése téves döntéshozatalhoz vezethet, ha tudatosság nélkül történik. Vannak azonban olyan helyzetek, amikor csak a korrelációs adatokhoz férünk hozzá. Ezekben az esetekben kritikus fontosságú annak megvizsgálása, hogy a korreláció pusztán véletlen egybeesés-e, vagy van-e érvényes kiváltó ok. 

Vegyük például a kihívást a marketingkiadások hozzárendelésének mérése és az értékesítési tevékenységek elemzése. Ezek összetett feladatok, amelyeknek nincs közvetlen ok-okozati összefüggése. 90%-os zárási arányt figyelhetünk meg, amikor az ügyfelek felkeresik az eladó irodáját egy ügyféltájékoztató céljából, de fontos, hogy ne vonjunk le elhamarkodott következtetéseket és ne feltételezzük az okozati összefüggést. Ehelyett árnyaltabb megközelítésre van szükség.  

Közelebbről megvizsgálva nyilvánvalóvá válik, hogy a magas zárási arány nem annak a következménye, hogy minden értékesítési interakcióhoz egyszerűen ütemezzük a vevői eligazításokat. Ehelyett maguk az interakciók késztetik az ügyfelekben a vágyat, hogy részt vegyenek ezeken a tájékoztatókon, ami ezt követően magas zárási arányhoz vezet. Ez a példa a művészet és a tudomány fúzióját szemlélteti analitika – olyan folyamat, amely magában foglalja a mögöttes dinamikák megértését, és nem csak a felületes összefüggésekre hagyatkozik. 

Mindannyian szeretnénk a rengeteg adat statisztikai megbízhatóságát az ideális adatkészlettel. A valóság az, hogy néha kreatívnak és ötletesnek kell lennünk, és meg kell vizsgálnunk a kiugró értékeket, összefüggéseket és alternatív adatkészleteket. Vagy néha nincs idő, és korlátozott adatok alapján kell cselekednie. 

Időbélyeg:

Még több ADATVERZITÁS