Επεξηγησιμότητα Δεδομένων: Το Αντίστοιχο Επεξηγησιμότητας Μοντέλου - ΔΙΑΒΟΛΗ ΔΕΔΟΜΕΝΩΝ

Επεξηγησιμότητα Δεδομένων: Το Αντίστοιχο Επεξηγησιμότητας Μοντέλου – ΔΥΝΑΤΟΤΗΤΑ ΔΕΔΟΜΕΝΩΝ

Κόμβος πηγής: 2658143

Σήμερα, το AI και το ML είναι παντού. 

Είτε παίζουν όλοι μαζί ChatGPT (ο πιο γρήγορος υιοθετημένη εφαρμογή στην ιστορία) ή μια πρόσφατη πρόταση για προσθήκη ένα τέταρτο χρώμα στα φανάρια Για να γίνει ασφαλέστερη η μετάβαση στα αυτοοδηγούμενα αυτοκίνητα, η τεχνητή νοημοσύνη έχει κορεστεί πλήρως τη ζωή μας. Ενώ η τεχνητή νοημοσύνη μπορεί να φαίνεται πιο προσιτή από ποτέ, η πολυπλοκότητα των μοντέλων τεχνητής νοημοσύνης έχει αυξηθεί εκθετικά. 

Τα μοντέλα AI εμπίπτουν στις κύριες κατηγορίες μοντέλων μαύρου κουτιού και λευκού κουτιού. Τα μοντέλα μαύρου κουτιού παίρνουν μια απόφαση χωρίς εξήγηση, ενώ τα μοντέλα λευκού κουτιού παρέχουν ένα αποτέλεσμα με βάση τους κανόνες που παρήγαγαν αυτό το αποτέλεσμα. 

Καθώς συνεχίζουμε να προχωράμε προς έναν κόσμο ολόκληρων μεθόδων βαθιάς μάθησης, οι περισσότερες έλκονται σε μεγάλο βαθμό προς τα μοντέλα μαύρου κουτιού. 

Το θέμα με αυτή την προσέγγιση; Τα μοντέλα μαύρου κουτιού (όπως αυτά που είναι ενσωματωμένα στην όραση υπολογιστή) δεν μπορούν να καταναλωθούν απευθείας. Αυτό αναφέρεται συχνά ως το πρόβλημα του μαύρου κουτιού. Ενώ η επανεκπαίδευση μοντέλων μαύρου κουτιού μπορεί να δώσει στους χρήστες μια νέα αρχή, η ερμηνεία του μοντέλου και η κατανόηση των αποτελεσμάτων του μοντέλου μαύρου κουτιού γίνεται πιο δύσκολη καθώς τα μοντέλα αυξάνονται σε πολυπλοκότητα.

Μια τακτική για να αντιμετωπίσετε το αίνιγμα του μαύρου κουτιού είναι να δημιουργήσετε ένα πολύ προσαρμοσμένο και εξηγήσιμο μοντέλο. 

Όμως, αυτή δεν είναι η κατεύθυνση που κινείται ο κόσμος. 

Όπου τελειώνει η επεξήγηση του μοντέλου, αρχίζει η επεξηγισιμότητα των δεδομένων

Η επεξήγηση είναι κρίσιμη επειδή βελτιώνει τη διαφάνεια, την ακρίβεια και τη δικαιοσύνη του μοντέλου και μπορεί επίσης να βελτιώσει την εμπιστοσύνη στην τεχνητή νοημοσύνη. Ενώ η επεξήγηση του μοντέλου είναι μια συμβατική προσέγγιση, τώρα προκύπτει επίσης η ανάγκη για έναν νέο τύπο: την επεξήγηση δεδομένων.

Επεξήγηση μοντέλου σημαίνει κατανόηση του αλγορίθμου, προκειμένου να κατανοήσουμε το τελικό αποτέλεσμα. Για παράδειγμα, εάν ένα μοντέλο που χρησιμοποιείται σε μια ογκολογική μονάδα έχει σχεδιαστεί για να ελέγξει εάν μια ανάπτυξη είναι καρκινική, ένας πάροχος υγειονομικής περίθαλψης θα πρέπει να κατανοήσει τις μεταβλητές που δημιουργούν τα τελικά αποτελέσματα. Αν και αυτό ακούγεται υπέροχο στη θεωρία, η επεξήγηση του μοντέλου δεν αντιμετωπίζει αρκετά το πρόβλημα του μαύρου κουτιού. 

Καθώς τα μοντέλα γίνονται όλο και πιο περίπλοκα, οι περισσότεροι επαγγελματίες δεν θα είναι σε θέση να εντοπίσουν τους μετασχηματισμούς και να ερμηνεύσουν τους υπολογισμούς στα εσωτερικά στρώματα του μοντέλου. Βασίζονται σε μεγάλο βαθμό σε αυτά που μπορούν να ελέγξουν, δηλαδή στα σύνολα δεδομένων εκπαίδευσης και σε αυτά που παρατηρούν, στα αποτελέσματα και στα μέτρα πρόβλεψης.  

Ας χρησιμοποιήσουμε το παράδειγμα ενός επιστήμονα δεδομένων που κατασκευάζει ένα μοντέλο για να ανιχνεύσει φωτογραφίες κούπες καφέ από χιλιάδες φωτογραφίες – αλλά το μοντέλο αρχίζει επίσης να ανιχνεύει εικόνες ποτηριών και κούπες μπύρας, για παράδειγμα. Ενώ οι κούπες του γυαλιού και της μπύρας μπορεί να έχουν κάποια ομοιότητα με τις κούπες καφέ, υπάρχουν ευδιάκριτες διαφορές, όπως τυπικά υλικά, χρώμα, αδιαφάνεια και δομικές αναλογίες.

Προκειμένου το μοντέλο να ανιχνεύει κούπες καφέ με υψηλότερη αξιοπιστία, ο επιστήμονας δεδομένων πρέπει να έχει τις απαντήσεις σε ερωτήσεις όπως:

  • Τι εικόνες πήρε το μοντέλο αντί για κούπες καφέ; 
  • Μήπως το μοντέλο απέτυχε επειδή δεν του παρείχα αρκετά ή τα σωστά παραδείγματα κούπες καφέ;
  • Είναι αυτό το μοντέλο αρκετά καλό για αυτό που προσπαθούσα να πετύχω;
  • Πρέπει να αμφισβητήσω την άποψή μου για το μοντέλο;
  • Τι μπορώ να προσδιορίσω με βεβαιότητα ότι προκαλεί την αποτυχία του μοντέλου; 
  • Πρέπει να δημιουργήσω νέες υποθέσεις για το μοντέλο;
  • Μήπως απλά επέλεξα λάθος μοντέλο για τη δουλειά για αρχή;

Όπως μπορείτε να δείτε, η παροχή αυτού του είδους πληροφοριών, κατανόησης και επεξήγησης μοντέλων κάθε φορά που υπάρχει ένα πρόβλημα είναι εξαιρετικά απίθανο.

Η επεξήγηση των δεδομένων είναι η κατανόηση του ημερομηνία χρησιμοποιείται για εκπαίδευση και εισαγωγή σε ένα μοντέλο, προκειμένου να κατανοηθεί πώς επιτυγχάνεται το τελικό αποτέλεσμα ενός μοντέλου. Καθώς οι αλγόριθμοι ML γίνονται όλο και πιο περίπλοκοι, αλλά χρησιμοποιούνται ευρύτερα σε επαγγέλματα και βιομηχανίες, η επεξήγηση των δεδομένων θα χρησιμεύσει ως το κλειδί για το γρήγορο ξεκλείδωμα και επίλυση κοινών προβλημάτων, όπως το παράδειγμα της κούπας καφέ μας.

Αύξηση της Δικαιοσύνης και της Διαφάνειας στο ML με την Επεξήγηση δεδομένων

Η δικαιοσύνη στα μοντέλα ML είναι ένα καυτό θέμα, το οποίο μπορεί να γίνει ακόμα πιο καυτό με την εφαρμογή της επεξηγηματικότητας των δεδομένων.

Γιατί το βουητό; Η προκατάληψη στην τεχνητή νοημοσύνη μπορεί να δημιουργήσει προκαταλήψεις για μια ομάδα. Μία από τις πιο καλά τεκμηριωμένες περιπτώσεις αυτού είναι οι προκαταλήψεις σε περιπτώσεις φυλετικής χρήσης. Ας δούμε ένα παράδειγμα. 

Ας πούμε ότι μια μεγάλη, γνωστή πλατφόρμα καταναλωτών προσλαμβάνει για μια νέα θέση διευθυντή μάρκετινγκ. Για να αντιμετωπίσει το πλήθος των βιογραφικών που λαμβάνονται καθημερινά, το τμήμα ανθρώπινου δυναμικού αναπτύσσει ένα μοντέλο AI/ML για να εξορθολογίσει τη διαδικασία αίτησης και πρόσληψης επιλέγοντας βασικά χαρακτηριστικά ή κατάλληλους υποψήφιους. 

Για να εκτελέσει αυτή την εργασία, και να διακρίνει και να βάλει σε κάδους κάθε βιογραφικό, το μοντέλο θα το κάνει κάνοντας νόημα στα βασικά κυρίαρχα χαρακτηριστικά. Δυστυχώς, αυτό Επίσης σημαίνει ότι το μοντέλο θα μπορούσε σιωπηρά να λάβει υπόψη τις γενικές φυλετικές προκαταλήψεις και στους υποψηφίους. Πώς ακριβώς θα συνέβαινε αυτό; Εάν μια ομάδα υποψηφίων περιλαμβάνει ένα μικρότερο ποσοστό μιας φυλής, το μηχάνημα θα σκεφτεί ότι ο οργανισμός προτιμά μέλη μιας διαφορετικής φυλής ή του κυρίαρχου συνόλου δεδομένων.

Εάν ένα μοντέλο αποτύχει, ακόμη και αν είναι ακούσιο, η αποτυχία πρέπει να αντιμετωπιστεί από την εταιρεία. Ουσιαστικά, όποιος ανέπτυξε το μοντέλο πρέπει να μπορεί να υπερασπιστεί τη χρήση του μοντέλου.

Στην περίπτωση πρόσληψης και φυλετικής προκατάληψης, ο υπερασπιστής θα πρέπει να μπορεί να εξηγήσει σε ένα θυμωμένο κοινό ή/και ομάδα εφαρμογών τη χρήση συνόλων δεδομένων για την εκπαίδευση του μοντέλου, τα αρχικά επιτυχημένα αποτελέσματα του μοντέλου που βασίζεται σε αυτήν την εκπαίδευση, την αποτυχία το μοντέλο που έπρεπε να ακολουθήσει σε μια γωνιακή θήκη και πώς αυτό οδήγησε σε μια ακούσια ανισορροπία δεδομένων που τελικά δημιούργησε μια φυλετικά προκατειλημμένη διαδικασία φιλτραρίσματος.

Για τους περισσότερους, αυτού του είδους οι λεπτές λεπτομέρειες σχετικά με την τεχνητή νοημοσύνη, τα σύνολα δεδομένων ανισορροπίας, την εκπαίδευση μοντέλων και την ενδεχόμενη αποτυχία μέσω της επίβλεψης δεδομένων δεν πρόκειται να γίνουν δεκτά καλά ή ακόμη και κατανοητά. Τι θα γίνει όμως κατανοητό και κολλημένο από αυτή την ιστορία; Η εταιρεία XYZ ασκεί φυλετική προκατάληψη στις προσλήψεις. 

Το ηθικό δίδαγμα αυτού του πολύ συνηθισμένου παραδείγματος είναι ότι όντως συμβαίνουν ακούσια λάθη από ένα πολύ έξυπνο μοντέλο και μπορούν να επηρεάσουν αρνητικά τους ανθρώπους και να έχουν τρομερές συνέπειες. 

Πού μας οδηγεί η επεξήγηση των δεδομένων

Αντί να μεταφράζει τα αποτελέσματα μέσω της κατανόησης ενός σύνθετου μοντέλου μηχανικής μάθησης, η επεξηγησιμότητα δεδομένων χρησιμοποιεί τα δεδομένα για να εξηγήσει προβλέψεις και αποτυχίες.

Η επεξήγηση των δεδομένων είναι τότε ένας συνδυασμός της προβολής των δεδομένων δοκιμής και  κατανοώντας τι θα πάρει ένα μοντέλο από αυτά τα δεδομένα. Αυτό περιλαμβάνει την κατανόηση υποεκπροσωπούμενων δειγμάτων δεδομένων, δειγμάτων που υπερεκπροσωπούνται (όπως στο παράδειγμα πρόσληψης) και τη διαφάνεια της ανίχνευσης ενός μοντέλου προκειμένου να κατανοηθούν με ακρίβεια οι προβλέψεις και οι εσφαλμένες προβλέψεις.

Αυτή η κατανόηση της επεξηγηματικότητας των δεδομένων όχι μόνο θα βελτιώσει την ακρίβεια και τη δικαιοσύνη του μοντέλου, αλλά θα είναι επίσης αυτό που βοηθά τα μοντέλα να επιταχύνουν ταχύτερα.

Καθώς συνεχίζουμε να βασιζόμαστε και να ενσωματώνουμε σύνθετα προγράμματα AI και ML στην καθημερινή μας ζωή, η επίλυση του προβλήματος του μαύρου κουτιού καθίσταται κρίσιμη, ιδιαίτερα για αποτυχίες και εσφαλμένες προβλέψεις. 

Ενώ η επεξήγηση του μοντέλου θα έχει πάντα τη θέση της, απαιτεί ένα άλλο επίπεδο. Χρειαζόμαστε επεξήγηση δεδομένων, καθώς η κατανόηση του τι βλέπει και διαβάζει ένα μοντέλο δεν θα καλύπτεται ποτέ από την κλασική επεξήγηση του μοντέλου.

Σφραγίδα ώρας:

Περισσότερα από ΔΕΔΟΜΕΝΟΤΗΤΑ