Τέσσερις προοπτικές για την τέχνη της ανάλυσης δεδομένων - ΔΙΑΒΟΛΗ ΔΕΔΟΜΕΝΩΝ

Τέσσερις προοπτικές για την τέχνη της ανάλυσης δεδομένων – ΔΙΑΒΟΛΗ ΔΕΔΟΜΕΝΩΝ

Κόμβος πηγής: 3059543

Ως επαγγελματίες της επιστήμης δεδομένων, θεωρούμαστε συχνά ως άνθρωποι που εξάγουν συμπεράσματα με βάση μόνο δεδομένα και ελαχιστοποιούν άλλους παράγοντες. Αυτή η αντίληψη γίνεται συνήθως αμφιλεγόμενη όταν οι ιδέες και τα στοιχεία από τα δεδομένα δεν συνάδουν με την «υπόθεση» κάποιου άλλου. Ή μπερδευόμαστε και ίσως απογοητευόμαστε όταν η «ποιοτική» ανάλυση υπερισχύει της ποσοτικής ανάλυσης. Την επόμενη φορά που θα νιώσετε αυτή την απογοήτευση, εξετάστε αυτές τις τέσσερις προοπτικές για την ανάλυση δεδομένων για επικύρωση και εξετάστε άλλες απόψεις, ώστε να προσπαθήσετε να βρείτε κοινό έδαφος:  

1. «Εξαιρετικές ίσες ευκαιρίες».  

Οι ακραίες τιμές παρουσιάζονται σε ένα σύνολο δεδομένων ως ανωμαλίες. Ίσως τα ακραία σημεία είναι θόρυβος, αλλά ίσως είναι ξεχωριστά. 

Τα ακραία σημεία θα μπορούσαν να είναι μοναδικές πληροφορίες, αναδυόμενες τάσεις ή ενδιαφέροντα τμήματα. Στην ιατρική έρευνα, ένα ακραίο στοιχείο θα μπορούσε να υποδείξει μια σπάνια αλλά απειλητική για τη ζωή παρενέργεια ενός φαρμάκου. Στην περίπτωση των δεδομένων πελατών, ένα ακραίο στοιχείο μπορεί να είναι μια πολύτιμη θέση πελατών που δεν έχει ακόμη αντιμετωπιστεί. Οι ακραίες τιμές θα μπορούσαν να είναι μια αναδυόμενη τάση. Το ροζ χρώμα ξεκίνησε ως ακραίο, αλλά γρήγορα έγινε η πιο δημοφιλής επιλογή μόδας. 

Πριν απορρίψετε τα ακραία στοιχεία ως θόρυβο, χρησιμοποιήστε τα για να πυροδοτήσετε ερωτήσεις και περιέργεια:   

  • Το ακραίο δείχνει μια ευκαιρία;   
  • Γιατί υπάρχει το ακραίο;   
  • Εάν μπορούσατε να αλλάξετε τη χρονική σήμανση του συνόλου δεδομένων σας, πώς θα μπορούσε αυτό να επηρεάσει τις ακραίες τιμές; 
  • Θα έπρεπε να υποθέσετε εάν υπάρχουν περισσότερες ακραίες τιμές;  
  • Τι μας λέει ένα ακραίο στοιχείο για το σύστημα ή τη διαδικασία που αναλύεται;    
  • Τι θα χρειαζόταν για να γίνει ένα ξεχωριστό προφίλ ή τμήμα;  

Η κατανόηση των ακραίων τιμών μπορεί να οδηγήσει στην ανάπτυξη καινοτόμων προϊόντων, στον εντοπισμό νέων ευκαιριών στην αγορά και στην αναγνώριση πιθανών κινδύνων. Σε τομείς όπως η περιβαλλοντική επιστήμη ή η οικονομία, οι ακραίες τιμές μπορούν να σηματοδοτήσουν σημαντικές αλλαγές προτύπων, όπως ξαφνικές κλιματικές αλλαγές ή οικονομικές κρίσεις. Τα ακραία στοιχεία έχουν τη δυνατότητα να μεταμορφώσουν τον τρόπο με τον οποίο βλέπουμε και ερμηνεύουμε δεδομένα, αλλάζοντας τα από παρεξηγημένα σημεία δεδομένων σε πολύτιμα πετράδια πληροφοριών. 

2. «Μια φορά είναι τυχαίο. Το δύο φορές είναι σύμπτωση. Τρεις φορές είναι η ενέργεια του εχθρού». -Χρυσό δάχτυλο  

Αναρωτηθήκατε ποτέ γιατί οι άλλοι νιώθουν άνετα να κάνουν "βασίζονται σε δεδομένα” αποφάσεις με πολύ περιορισμένες πληροφορίες; Περισσότερα σημεία δεδομένων μας δίνουν σε όλους περισσότερη εμπιστοσύνη και μεγαλύτερη ακρίβεια, αλλά μερικές φορές χρειάζεται να ενεργούμε γρήγορα.  

Πιο πρόσφατα, το OpenAI κυκλοφόρησε το ChatGPT παρά τα ελαττώματα του, ενώ άλλοι που είχαν παρόμοια προϊόντα περίμεναν να αυξήσουν το επίπεδο εμπιστοσύνης τους στην ακρίβεια των απαντήσεων. Όταν νομίζετε ότι κάποιος λαμβάνει μια απόφαση βάσει δεδομένων με χαμηλά επίπεδα εμπιστοσύνης και περιορισμένη ακρίβεια, σκεφτείτε το κόστος του χρόνου. Ο εχθρός μπορεί να πυροβολεί. 

3. «Δεν μπορούν να μετρηθούν ό,τι μετράει και δεν μετράει ό,τι μπορεί να μετρηθεί». – αποδίδεται συνήθως στον Άλμπερτ Αϊνστάιν 

Με άλλα λόγια, «Εκτιμώ την ανάλυση των δεδομένων σας, αλλά αυτό που σκέφτομαι ή ακούω είναι πιο σημαντικό. Δεν μπορεί να μετρηθεί ή να μετρηθεί». 

Πώς απαντάτε; Αυτή η κατάσταση είναι όπου πρέπει να γίνετε δημιουργικοί.   

Για παράδειγμα, η συμπεριφορά των πελατών, συμπεριλαμβανομένου του συναισθήματος των πελατών, της αφοσίωσης στην επωνυμία και των τάσεων που οδηγούνται από πολιτισμικές αλλαγές, μπορεί να είναι άυλη και δύσκολο να προσδιοριστεί ποσοτικά. Εάν διαθέτετε μόνο δεδομένα συμπεριφοράς στο διαδίκτυο, χρησιμοποιήστε άλλες μεθόδους για να αποκτήσετε πρόσβαση σε νέες πηγές δεδομένων, όπως προγράμματα δοκιμών, έρευνες, ανάλυση κοινωνικού συναισθήματος, διαδικτυακή εθνογραφία ή βασικές πρωτογενείς έρευνες πελατών.  

Ίσως τίποτα δεν θα είναι οριστικό, αλλά ο συνδυασμός και η συνέπεια διαφορετικών μεθόδων και πηγών είναι που οδηγούν σε ένα συνεπές συμπέρασμα.  

4. «Η συσχέτιση ισούται με αιτιότητα;»  

Η αντικατάσταση της συσχέτισης για την αιτιότητα μπορεί να οδηγήσει σε λανθασμένη λήψη αποφάσεων όταν γίνεται χωρίς επίγνωση. Ωστόσο, υπάρχουν περιπτώσεις όπου έχουμε πρόσβαση μόνο σε δεδομένα συσχέτισης. Σε αυτές τις περιπτώσεις, είναι σημαντικό να εξεταστεί εάν η συσχέτιση είναι απλή σύμπτωση ή εάν υπάρχει μια έγκυρη υποκείμενη αιτία. 

Για παράδειγμα, εξετάστε την πρόκληση της μέτρησης της απόδοσης δαπανών μάρκετινγκ και της ανάλυσης των δραστηριοτήτων πωλήσεων. Αυτές είναι πολύπλοκες εργασίες χωρίς άμεση αιτιώδη συνάφεια. Θα μπορούσε κανείς να παρατηρήσει ένα ποσοστό κλεισίματος 90% όταν οι πελάτες επισκέπτονται το γραφείο ενός πωλητή για μια ενημέρωση πελατών, αλλά είναι σημαντικό να μην βιαστούμε σε συμπεράσματα και να υποθέσουμε την αιτιώδη συνάφεια. Αντίθετα, χρειάζεται μια πιο διαφοροποιημένη προσέγγιση.  

Μετά από πιο προσεκτική εξέταση, γίνεται προφανές ότι το υψηλό ποσοστό κλεισίματος δεν είναι αποτέλεσμα απλώς προγραμματισμού ενημερώσεων πελατών για κάθε αλληλεπίδραση πωλήσεων. Αντίθετα, οι ίδιες οι αλληλεπιδράσεις δημιουργούν την επιθυμία στους πελάτες να παρακολουθήσουν αυτές τις ενημερώσεις, κάτι που στη συνέχεια οδηγεί σε υψηλό ποσοστό κλεισίματος. Αυτό το παράδειγμα απεικονίζει τη συγχώνευση τέχνης και επιστήμης analytics – μια διαδικασία που περιλαμβάνει την κατανόηση της υποκείμενης δυναμικής και όχι απλώς τη βάση σε επιφανειακές συσχετίσεις. 

Όλοι θα θέλαμε τη στατιστική εμπιστοσύνη πολλών δεδομένων με το ιδανικό σύνολο δεδομένων. Η πραγματικότητα είναι ότι μερικές φορές, πρέπει να γίνουμε δημιουργικοί και ευφάνταστοι και να εξετάσουμε ακραίες τιμές, συσχετίσεις και εναλλακτικά σύνολα δεδομένων. Ή μερικές φορές, δεν υπάρχει χρόνος και πρέπει να ενεργήσετε με περιορισμένα δεδομένα. 

Σφραγίδα ώρας:

Περισσότερα από ΔΕΔΟΜΕΝΟΤΗΤΑ