Γιατί τα LLM που χρησιμοποιούνται μόνα τους δεν μπορούν να καλύψουν τις προγνωστικές ανάγκες της εταιρείας σας - KDnuggets

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Σύνδεσμοι Περιεχόμενο

Το ChatGPT και παρόμοια εργαλεία που βασίζονται σε μεγάλα γλωσσικά μοντέλα (LLM) είναι εκπληκτικά. Αλλά δεν είναι εργαλεία για όλες τις χρήσεις.

Είναι ακριβώς σαν να επιλέγετε άλλα εργαλεία για την κατασκευή και τη δημιουργία. Πρέπει να επιλέξετε το κατάλληλο για τη δουλειά. Δεν θα προσπαθήσετε να σφίξετε ένα μπουλόνι με ένα σφυρί ή να γυρίσετε ένα μπιφτέκι χάμπουργκερ με ένα σύρμα. Η διαδικασία θα ήταν άβολη, με αποτέλεσμα μια ακατάστατη αποτυχία.

Τα γλωσσικά μοντέλα όπως τα LLM αποτελούν μόνο ένα μέρος της ευρύτερης εργαλειοθήκης μηχανικής μάθησης, που περιλαμβάνει τόσο τη γενετική όσο και την προγνωστική τεχνητή νοημοσύνη. Η επιλογή του σωστού τύπου μοντέλου μηχανικής εκμάθησης είναι ζωτικής σημασίας για την ευθυγράμμιση με τις απαιτήσεις της εργασίας σας.

Ας εμβαθύνουμε στο γιατί τα LLM είναι πιο κατάλληλα για να σας βοηθήσουν να συντάξετε κείμενο ή να δημιουργήσετε ιδέες για δώρα παρά για να αντιμετωπίσετε τις πιο κρίσιμες εργασίες πρόβλεψης μοντελοποίησης της επιχείρησής σας. Υπάρχει ακόμη ζωτικός ρόλος για τα «παραδοσιακά» μοντέλα μηχανικής μάθησης που προηγήθηκαν των LLM και έχουν επανειλημμένα αποδείξει την αξία τους στις επιχειρήσεις. Θα διερευνήσουμε επίσης μια πρωτοποριακή προσέγγιση για τη χρήση αυτών των εργαλείων μαζί — μια συναρπαστική εξέλιξη που αποκαλούμε στην Pecan Προγνωστικό GenAI.

Τα LLM είναι σχεδιασμένα για λέξεις, όχι για αριθμούς

Στη μηχανική μάθηση, χρησιμοποιούνται διαφορετικές μαθηματικές μέθοδοι για την ανάλυση αυτού που είναι γνωστό ως "δεδομένα εκπαίδευσης" - ένα αρχικό σύνολο δεδομένων που αντιπροσωπεύει το πρόβλημα που ένας αναλυτής δεδομένων ή ένας επιστήμονας δεδομένων ελπίζει να λύσει.

Η σημασία των δεδομένων εκπαίδευσης δεν μπορεί να υπερεκτιμηθεί. Κρατάει μέσα του τα μοτίβα και τις σχέσεις που θα «μάθει» ένα μοντέλο μηχανικής μάθησης να προβλέπει αποτελέσματα όταν αργότερα του δοθούν νέα, αόρατα δεδομένα.

Λοιπόν, τι είναι συγκεκριμένα ένα LLM; Τα μεγάλα γλωσσικά μοντέλα ή LLM εμπίπτουν στην ομπρέλα της μηχανικής μάθησης. Προέρχονται από τη βαθιά μάθηση και η δομή τους έχει αναπτυχθεί ειδικά για επεξεργασία φυσικής γλώσσας.

Θα μπορούσατε να πείτε ότι είναι χτισμένα σε μια βάση λέξεων. Στόχος τους είναι απλώς να προβλέψουν ποια λέξη θα είναι η επόμενη σε μια σειρά λέξεων. Για παράδειγμα, η δυνατότητα αυτόματης διόρθωσης των iPhone στο iOS 17 χρησιμοποιεί τώρα ένα LLM για να προβλέψει καλύτερα ποια λέξη θα σκοπεύετε να πληκτρολογήσετε στη συνέχεια.

Πλεονεκτήματα του LLM και της Παραδοσιακής Μηχανικής Μάθησης

Τώρα, φανταστείτε ότι είστε μοντέλο μηχανικής μάθησης. (Αντέξτε μαζί μας, ξέρουμε ότι είναι ένα τέντωμα.) Έχετε εκπαιδευτεί να προβλέπετε λέξεις. Έχετε διαβάσει και μελετήσει εκατομμύρια λέξεις από ένα ευρύ φάσμα πηγών για όλα τα είδη θεμάτων. Οι μέντοράς σας (γνωστοί και ως προγραμματιστές) σάς βοήθησαν να μάθετε τους καλύτερους τρόπους πρόβλεψης λέξεων και δημιουργίας νέου κειμένου που να ταιριάζει στο αίτημα ενός χρήστη.

Αλλά εδώ υπάρχει μια ανατροπή. Ένας χρήστης σάς δίνει τώρα ένα τεράστιο υπολογιστικό φύλλο δεδομένων πελατών και συναλλαγών, με εκατομμύρια σειρές αριθμών και σας ζητά να προβλέψετε αριθμούς που σχετίζονται με αυτά τα υπάρχοντα δεδομένα.

Πώς πιστεύετε ότι θα εξελιχθούν οι προβλέψεις σας; Πρώτον, πιθανότατα θα ενοχληθήκατε που αυτή η εργασία δεν ταιριάζει με αυτό που δουλέψατε τόσο σκληρά για να μάθετε. (Ευτυχώς, από όσο γνωρίζουμε, οι LLMs δεν έχουν ακόμα συναισθήματα.) Το πιο σημαντικό, σας ζητείται να κάνετε μια εργασία που δεν ταιριάζει με αυτό που έχετε μάθει να κάνετε. Και μάλλον δεν θα αποδώσεις τόσο καλά.

Το χάσμα μεταξύ εκπαίδευσης και εργασίας εξηγεί γιατί τα LLM δεν είναι κατάλληλα για προγνωστικές εργασίες που περιλαμβάνουν αριθμητικά, πινακοειδή δεδομένα — την κύρια μορφή δεδομένων που συλλέγουν οι περισσότερες επιχειρήσεις. Αντίθετα, ένα μοντέλο μηχανικής εκμάθησης που έχει δημιουργηθεί και βελτιστοποιηθεί ειδικά για το χειρισμό αυτού του τύπου δεδομένων είναι πιο αποτελεσματικό. Είναι κυριολεκτικά εκπαιδευμένο για αυτό.

Προκλήσεις αποτελεσματικότητας και βελτιστοποίησης των LLMs

Εκτός από το ότι ταιριάζουν καλύτερα με τα αριθμητικά δεδομένα, οι παραδοσιακές μέθοδοι μηχανικής εκμάθησης είναι πολύ πιο αποτελεσματικές και πιο εύκολο να βελτιστοποιηθούν για καλύτερη απόδοση από τα LLM.

Ας επιστρέψουμε στην εμπειρία σας με την πλαστοπροσωπία ενός LLM. Η ανάγνωση όλων αυτών των λέξεων και η μελέτη του στυλ και της αλληλουχίας τους ακούγεται σαν ένας τόνος δουλειάς, σωστά; Θα χρειαζόταν πολλή προσπάθεια για να εσωτερικοποιηθούν όλες αυτές οι πληροφορίες.

Ομοίως, η σύνθετη εκπαίδευση των LLMs μπορεί να οδηγήσει σε μοντέλα με δισεκατομμύρια παραμέτρους. Αυτή η πολυπλοκότητα επιτρέπει σε αυτά τα μοντέλα να κατανοούν και να ανταποκρίνονται στις δύσκολες αποχρώσεις της ανθρώπινης γλώσσας. Ωστόσο, η προπόνηση βαρέων καθηκόντων συνοδεύεται από υπολογιστικές απαιτήσεις βαρέως τύπου όταν τα LLM παράγουν απαντήσεις. Οι αριθμητικά προσανατολισμένοι «παραδοσιακοί» αλγόριθμοι μηχανικής μάθησης, όπως τα δέντρα αποφάσεων ή τα νευρωνικά δίκτυα, πιθανότατα θα χρειάζονται πολύ λιγότερους υπολογιστικούς πόρους. Και αυτό δεν είναι μια περίπτωση του «μεγαλύτερο, τόσο καλύτερο». Ακόμα κι αν τα LLMs μπορούσαν να χειριστούν αριθμητικά δεδομένα, αυτή η διαφορά θα σήμαινε ότι οι παραδοσιακές μέθοδοι μηχανικής μάθησης θα εξακολουθούσαν να είναι πιο γρήγορες, πιο αποτελεσματικές, πιο περιβαλλοντικά βιώσιμες και πιο αποδοτικές.

Επιπλέον, έχετε ρωτήσει ποτέ το ChatGPT πώς ήξερε να παρέχει μια συγκεκριμένη απάντηση; Η απάντησή του πιθανότατα θα είναι λίγο ασαφής:

Δημιουργώ απαντήσεις που βασίζονται σε ένα μείγμα αδειοδοτημένων δεδομένων, δεδομένων που δημιουργούνται από ανθρώπινους εκπαιδευτές και δεδομένων που είναι διαθέσιμα στο κοινό. Η εκπαίδευσή μου περιελάμβανε επίσης μεγάλης κλίμακας σύνολα δεδομένων που προέρχονται από ποικίλες πηγές, συμπεριλαμβανομένων βιβλίων, ιστοσελίδων και άλλων κειμένων, για να αναπτύξω μια ευρεία κατανόηση της ανθρώπινης γλώσσας. Η διαδικασία εκπαίδευσης περιλαμβάνει την εκτέλεση υπολογισμών σε χιλιάδες GPU για εβδομάδες ή μήνες, αλλά οι ακριβείς λεπτομέρειες και τα χρονοδιαγράμματα είναι ιδιοκτησία του OpenAI.

Πόσο από τη «γνώση» που αντικατοπτρίζεται σε αυτή την απάντηση προήλθε από τους εκπαιδευτές ανθρώπων έναντι των δημόσιων δεδομένων έναντι των βιβλίων; Ακόμη και το ίδιο το ChatGPT δεν είναι σίγουρο: «Οι σχετικές αναλογίες αυτών των πηγών είναι άγνωστες και δεν έχω λεπτομερή ορατότητα σε ποια συγκεκριμένα έγγραφα ήταν μέρος του σετ εκπαίδευσής μου».

Είναι λίγο ανησυχητικό να έχετε το ChatGPT να παρέχει τόσο σίγουρες απαντήσεις στις ερωτήσεις σας, αλλά να μην μπορείτε να εντοπίσετε τις απαντήσεις του σε συγκεκριμένες πηγές. Η περιορισμένη ερμηνευτικότητα και επεξήγηση των LLMs θέτουν επίσης προκλήσεις στη βελτιστοποίησή τους για συγκεκριμένες επιχειρηματικές ανάγκες. Μπορεί να είναι δύσκολο να κατανοήσουμε τη λογική πίσω από τις πληροφορίες ή τις προβλέψεις τους. Για να περιπλέξουν περαιτέρω τα πράγματα, ορισμένες επιχειρήσεις αντιμετωπίζουν ρυθμιστικές απαιτήσεις που σημαίνει ότι πρέπει να είναι σε θέση να εξηγήσουν τους παράγοντες που επηρεάζουν τις προβλέψεις ενός μοντέλου. Συνολικά, αυτές οι προκλήσεις δείχνουν ότι τα παραδοσιακά μοντέλα μηχανικής εκμάθησης - γενικά πιο ερμηνεύσιμα και εξηγήσιμα - είναι πιθανώς καλύτερα κατάλληλα για περιπτώσεις επαγγελματικής χρήσης.

Η σωστή θέση για τα LLM στην εργαλειοθήκη πρόβλεψης των επιχειρήσεων

Λοιπόν, πρέπει απλώς να αφήσουμε τα LLM στα καθήκοντά τους που σχετίζονται με τη λέξη και να τα ξεχάσουμε για περιπτώσεις προγνωστικής χρήσης; Μπορεί τώρα να φαίνεται ότι δεν μπορούν να βοηθήσουν στην πρόβλεψη της απόρριψης πελατών ή της αξίας διάρκειας ζωής του πελάτη.

Αυτό είναι το εξής: Αν και λέγοντας «παραδοσιακά μοντέλα μηχανικής μάθησης» οι τεχνικές αυτές ακούγονται ευρέως κατανοητές και εύχρηστες, γνωρίζουμε από την εμπειρία μας στην Pecan ότι οι επιχειρήσεις εξακολουθούν να αγωνίζονται σε μεγάλο βαθμό να υιοθετήσουν ακόμη και αυτές τις πιο γνωστές μορφές AI.

Το 42% των εταιρειών στη Βόρεια Αμερική δεν έχουν αρχίσει καθόλου να χρησιμοποιούν τεχνητή νοημοσύνη ή μόλις αρχίζουν να ερευνούν τις επιλογές τους.

Πρόσφατη έρευνα του Workday αποκαλύπτει ότι το 42% των εταιρειών στη Βόρεια Αμερική είτε δεν έχουν ξεκινήσει τη χρήση της τεχνητής νοημοσύνης είτε βρίσκονται μόλις στα πρώτα στάδια της εξερεύνησης των επιλογών τους. Και έχει περάσει πάνω από μια δεκαετία από τότε που τα εργαλεία μηχανικής μάθησης έγιναν πιο προσιτά στις εταιρείες. Είχαν τον χρόνο και διάφορα εργαλεία είναι διαθέσιμα.

Για κάποιο λόγο, οι επιτυχημένες υλοποιήσεις τεχνητής νοημοσύνης ήταν εκπληκτικά σπάνιες παρά τον τεράστιο θόρυβο γύρω από την επιστήμη δεδομένων και την τεχνητή νοημοσύνη — και τις αναγνωρισμένες δυνατότητές τους για σημαντικό επιχειρηματικό αντίκτυπο. Λείπει κάποιος σημαντικός μηχανισμός που θα βοηθήσει στη γεφύρωση του χάσματος μεταξύ των υποσχέσεων που δίνει η τεχνητή νοημοσύνη και της ικανότητας για παραγωγική εφαρμογή της.

Και εκεί ακριβώς πιστεύουμε ότι τα LLM μπορούν πλέον να διαδραματίσουν ζωτικό ρόλο γεφύρωσης. Τα LLM μπορούν να βοηθήσουν τους επιχειρηματικούς χρήστες να περάσουν το χάσμα μεταξύ του εντοπισμού ενός επιχειρηματικού προβλήματος για επίλυση και της ανάπτυξης ενός προγνωστικού μοντέλου.

Με τα LLM τώρα στην εικόνα, οι ομάδες επιχειρήσεων και δεδομένων που δεν έχουν την ικανότητα ή την ικανότητα να κωδικοποιούν χειροκίνητα μοντέλα μηχανικής εκμάθησης μπορούν τώρα να μεταφράσουν καλύτερα τις ανάγκες τους σε μοντέλα. Μπορούν να «χρησιμοποιήσουν τα λόγια τους», όπως θέλουν να πουν οι γονείς, για να ξεκινήσουν τη διαδικασία μοντελοποίησης.

Συνδυάζοντας τα LLM με τεχνικές μηχανικής μάθησης που έχουν σχεδιαστεί για να υπερέχουν στα επιχειρηματικά δεδομένα

Αυτή η ικανότητα έφτασε τώρα στο Predictive GenAI της Pecan, το οποίο συνδυάζει τα δυνατά σημεία των LLM με την ήδη εξαιρετικά εκλεπτυσμένη και αυτοματοποιημένη πλατφόρμα μηχανικής εκμάθησης. Η Predictive Chat που υποστηρίζεται από LLM συλλέγει στοιχεία από έναν επιχειρηματικό χρήστη για να καθοδηγήσει τον ορισμό και την ανάπτυξη μιας προγνωστικής ερώτησης — το συγκεκριμένο πρόβλημα που θέλει να λύσει ο χρήστης με ένα μοντέλο.

Στη συνέχεια, χρησιμοποιώντας το GenAI, η πλατφόρμα μας δημιουργεί ένα Predictive Notebook για να κάνει το επόμενο βήμα προς τη μοντελοποίηση ακόμα πιο εύκολο. Και πάλι, βασιζόμενος στις δυνατότητες LLM, το σημειωματάριο περιέχει προσυμπληρωμένα ερωτήματα SQL για την επιλογή των δεδομένων εκπαίδευσης για το μοντέλο πρόβλεψης. Η αυτοματοποιημένη προετοιμασία δεδομένων, η μηχανική χαρακτηριστικών, η κατασκευή μοντέλων και οι δυνατότητες ανάπτυξης της Pecan μπορούν να πραγματοποιήσουν την υπόλοιπη διαδικασία σε χρόνο ρεκόρ, ταχύτερα από οποιαδήποτε άλλη λύση πρόβλεψης μοντελοποίησης.

Εν ολίγοις, το Predictive GenAI της Pecan χρησιμοποιεί τις απαράμιλλες γλωσσικές δεξιότητες των LLM για να κάνει την καλύτερη στην κατηγορία μας πλατφόρμα πρόβλεψης μοντελοποίησης πολύ πιο προσιτή και φιλική για τους επαγγελματίες χρήστες. Είμαστε ενθουσιασμένοι που βλέπουμε πώς αυτή η προσέγγιση θα βοηθήσει πολλές περισσότερες εταιρείες να πετύχουν με την τεχνητή νοημοσύνη.

Έτσι, ενώ οι LLMs alone δεν είναι κατάλληλα για να χειριστούν όλες τις προγνωστικές σας ανάγκες, μπορούν να διαδραματίσουν ισχυρό ρόλο στην προώθηση των έργων AI σας. Ερμηνεύοντας την περίπτωση χρήσης σας και δίνοντάς σας ένα προβάδισμα με κώδικα SQL που δημιουργείται αυτόματα, το Predictive GenAI της Pecan πρωτοπορεί στην ενοποίηση αυτών των τεχνολογιών. Μπορείς ελέγξτε το τώρα με μια δωρεάν δοκιμή.