Cztery perspektywy sztuki analizy danych - DATAVERSITY

Cztery perspektywy sztuki analityki danych – DATAVERSITY

Węzeł źródłowy: 3059543

Jako specjaliści zajmujący się analityką danych jesteśmy często postrzegani jako osoby, które wyciągają wnioski wyłącznie na podstawie danych i minimalizują inne czynniki. To postrzeganie zwykle staje się kontrowersyjne, gdy spostrzeżenia i dowody zawarte w danych są niezgodne z „hipotezą” innej osoby. Albo jesteśmy zdezorientowani i być może sfrustrowani, gdy analiza „jakościowa” przebija analizę ilościową. Następnym razem, gdy poczujesz tę frustrację, rozważ te cztery perspektywy analizy danych, aby zweryfikować i rozważyć inne poglądy, aby móc spróbować znaleźć wspólną płaszczyznę:  

1. „Równe szanse dla osób odstających”.  

Wartości odstające pojawiają się w zbiorze danych jako anomalie. Może wartości odstające to hałas, ale może są wyjątkowe. 

Wartości odstające mogą obejmować unikalne spostrzeżenia, pojawiające się trendy lub interesujące segmenty. W badaniach medycznych wartość odstająca może wskazywać na rzadkie, ale zagrażające życiu działanie niepożądane leku. W przypadku danych klientów wartość odstająca może stanowić cenną niszę klienta, która nie została jeszcze zaadresowana. Wartości odstające mogą być nowym trendem. Kolor różowy początkowo był czymś odbiegającym od normy, ale szybko stał się najpopularniejszym wyborem w modzie. 

Zanim odrzucisz wartości odstające jako szum, użyj ich, aby wywołać pytania i ciekawość:   

  • Czy wartość odstająca wskazuje na szansę?   
  • Dlaczego istnieje wartość odstająca?   
  • Gdybyś mógł zmienić znacznik czasu swojego zbioru danych, jak mogłoby to wpłynąć na wartości odstające? 
  • Czy musiałbyś zakładać, jeśli jest więcej wartości odstających?  
  • Co wartość odstająca mówi nam o analizowanym systemie lub procesie?    
  • Co musiałoby się wydarzyć, aby element odstający stał się odrębnym profilem lub segmentem?  

Zrozumienie wartości odstających może prowadzić do opracowania innowacyjnych produktów, zidentyfikowania nowych możliwości rynkowych i rozpoznania potencjalnych zagrożeń. W takich dziedzinach jak nauki o środowisku czy ekonomia wartości odstające mogą sygnalizować ważne zmiany wzorców, takie jak nagłe zmiany klimatyczne lub kryzysy finansowe. Wartości odstające mogą potencjalnie zmienić sposób, w jaki postrzegamy i interpretujemy dane, zmieniając je z niezrozumiałych punktów danych w cenne perełki informacji. 

2. „Raz to przypadek. Dwa razy to przypadek. Trzykrotna jest akcja wroga.” -Złoty palec  

Czy zastanawiałeś się kiedyś, dlaczego inni czują się komfortowo, robiąc „sterowane danymi” decyzje na podstawie bardzo ograniczonych informacji? Więcej punktów danych daje nam wszystkim większą pewność i większą dokładność, ale czasami musimy działać szybko.  

Niedawno OpenAI uruchomiło ChatGPT pomimo swoich wad, podczas gdy inni, którzy mieli podobne produkty, czekali na zwiększenie poziomu pewności co do dokładności odpowiedzi. Jeśli sądzisz, że ktoś podejmuje decyzję w oparciu o dane, mając niski poziom pewności i ograniczoną dokładność, weź pod uwagę koszt czasu. Wróg może strzelać. 

3. „Nie wszystko, co się liczy, można policzyć i nie wszystko, co można policzyć, się liczy”. – powszechnie przypisywane Albertowi Einsteinowi 

Innymi słowy: „Doceniam Twoją analizę danych, ale to, co myślę lub słyszę, jest ważniejsze. Tego nie da się policzyć ani zmierzyć.” 

Jak odpowiadasz? W tej sytuacji musisz wykazać się kreatywnością.   

Na przykład zachowania klientów, w tym ich nastroje, lojalność wobec marki i trendy wynikające ze zmian kulturowych, mogą być nieuchwytne i trudne do oszacowania. Jeśli dysponujesz wyłącznie danymi dotyczącymi zachowań online, skorzystaj z innych metod uzyskiwania dostępu do nowych źródeł danych, takich jak programy testowe, ankiety, analiza nastrojów społecznych, etnografia online lub podstawowe badania klientów.  

Być może nic nie będzie ostateczne, ale to połączenie i spójność różnych metod i źródeł prowadzi do spójnego wniosku.  

4. „Korelacja równa się przyczynowości?”  

Zastąpienie związku przyczynowego korelacją może prowadzić do błędnego podejmowania decyzji, jeśli jest podejmowane bez świadomości. Są jednak sytuacje, w których mamy dostęp jedynie do danych korelacyjnych. W takich przypadkach niezwykle ważne jest sprawdzenie, czy korelacja jest zwykłym zbiegiem okoliczności, czy też istnieje uzasadniona przyczyna. 

Rozważmy na przykład wyzwanie polegające na pomiarze alokacji wydatków marketingowych i analizie działań sprzedażowych. Są to złożone zadania, które nie mają bezpośredniego związku przyczynowego. Gdy klienci odwiedzają biuro dostawcy w celu odprawy, można zaobserwować 90% wskaźnika zamknięcia transakcji, ważne jest jednak, aby nie wyciągać pochopnych wniosków i nie zakładać związku przyczynowego. Zamiast tego potrzebne jest bardziej zniuansowane podejście.  

Po bliższym przyjrzeniu się staje się oczywiste, że wysoki współczynnik zamykania transakcji nie jest wynikiem prostego planowania odpraw z klientami podczas każdej interakcji sprzedażowej. Zamiast tego same interakcje wywołują u klientów chęć wzięcia udziału w tych odprawach, co w konsekwencji prowadzi do wysokiego wskaźnika finalizacji transakcji. Ten przykład ilustruje fuzję sztuki i nauki w analityka – proces, który wymaga zrozumienia podstawowej dynamiki, a nie tylko polegania na powierzchownych korelacjach. 

Wszyscy chcielibyśmy mieć pewność statystyczną dużej ilości danych w przypadku idealnego zbioru danych. Rzeczywistość jest taka, że ​​czasami musimy wykazać się kreatywnością i wyobraźnią oraz zbadać wartości odstające, korelacje i alternatywne zbiory danych. Czasem nie ma już czasu i trzeba działać na podstawie ograniczonych danych. 

Znak czasu:

Więcej z WSZECHSTRONNOŚĆ DANYCH