Συναρπαστική απόδοση AI: Η ανάμειξη μικρότερων μοντέλων ξεπερνά τα μεγάλα αντίστοιχα

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Τα τελευταία χρόνια, το πεδίο της συνομιλίας AI έχει επηρεαστεί σημαντικά από μοντέλα όπως το ChatGPT, που χαρακτηρίζονται από τα εκτεταμένα μεγέθη παραμέτρων τους. Ωστόσο, αυτή η προσέγγιση συνοδεύεται από σημαντικές απαιτήσεις σε υπολογιστικούς πόρους και μνήμη. Μια μελέτη εισάγει τώρα μια νέα ιδέα: την ανάμειξη πολλών μικρότερων μοντέλων τεχνητής νοημοσύνης για την επίτευξη ή την υπέρβαση της απόδοσης μεγαλύτερων μοντέλων. Αυτή η προσέγγιση, που ονομάζεται «Μείξη», ενσωματώνει πολλαπλές τεχνητές νοημοσύνης συνομιλίας, προσφέροντας μια αποτελεσματική λύση στις υπολογιστικές προκλήσεις μεγάλων μοντέλων.

Η έρευνα, που διεξήχθη πάνω από τριάντα ημέρες με μια μεγάλη βάση χρηστών στην ερευνητική πλατφόρμα Chai, δείχνει ότι η ανάμειξη συγκεκριμένων μικρότερων μοντέλων μπορεί δυνητικά να έχει καλύτερη απόδοση ή να ταιριάζει με τις δυνατότητες πολύ μεγαλύτερων μοντέλων, όπως το ChatGPT. Για παράδειγμα, η ενσωμάτωση τριών μόνο μοντέλων με παραμέτρους 6B/13B μπορεί να ανταγωνιστεί ή ακόμη και να ξεπεράσει τις μετρήσεις απόδοσης σημαντικά μεγαλύτερων μοντέλων όπως το ChatGPT με παραμέτρους 175B+.

Η αυξανόμενη εξάρτηση από προεκπαιδευμένα μοντέλα μεγάλων γλωσσών (LLM) για διαφορετικές εφαρμογές, ιδιαίτερα στη συνομιλία AI, έχει οδηγήσει σε μια έκρηξη στην ανάπτυξη μοντέλων με τεράστιο αριθμό παραμέτρων. Ωστόσο, αυτά τα μεγάλα μοντέλα απαιτούν εξειδικευμένη υποδομή και έχουν σημαντικά γενικά έξοδα συμπερασμάτων, περιορίζοντας την προσβασιμότητά τους. Η συνδυασμένη προσέγγιση, από την άλλη πλευρά, προσφέρει μια πιο αποτελεσματική εναλλακτική λύση χωρίς συμβιβασμούς στην ποιότητα της συνομιλίας.

Η αποτελεσματικότητα του συνδυασμένου AI είναι εμφανής στα ποσοστά αφοσίωσης και διατήρησης χρηστών. Κατά τη διάρκεια δοκιμών μεγάλης κλίμακας A/B στην πλατφόρμα CHAI, τα Blended ensembles, που αποτελούνται από τρία LLM παραμέτρων 6-13B, ξεπέρασαν την παράμετρο ChatGPT 175B+ του OpenAI, επιτυγχάνοντας σημαντικά υψηλότερη διατήρηση και αφοσίωση χρηστών. Αυτό δείχνει ότι οι χρήστες βρήκαν τα Blended chat AI πιο ελκυστικά, διασκεδαστικά και χρήσιμα, όλα αυτά ενώ απαιτούν μόνο ένα κλάσμα του κόστους συμπερασμάτων και των επιβαρύνσεων μνήμης μεγαλύτερων μοντέλων.

Η μεθοδολογία της μελέτης περιλαμβάνει το σύνολο με βάση τις στατιστικές αρχές του Μπεϋζιανού, όπου η πιθανότητα μιας συγκεκριμένης απόκρισης εννοείται ως μια οριακή προσδοκία που λαμβάνεται υπόψη όλων των εύλογων παραμέτρων τεχνητής νοημοσύνης συνομιλίας. Το Blended επιλέγει τυχαία την τεχνητή νοημοσύνη συνομιλίας που δημιουργεί την τρέχουσα απόκριση, επιτρέποντας σε διαφορετικά AI συνομιλίας να επηρεάζουν σιωπηρά την έξοδο. Αυτό έχει ως αποτέλεσμα μια ανάμειξη των δυνατοτήτων τεχνητής νοημοσύνης μεμονωμένων συνομιλιών, οδηγώντας σε πιο συναρπαστικές και ποικίλες απαντήσεις.

Οι ανακαλύψεις στις τάσεις της τεχνητής νοημοσύνης και της μηχανικής μάθησης για το 2024 τονίζουν τη μετάβαση προς πιο πρακτικά, αποτελεσματικά και προσαρμόσιμα μοντέλα τεχνητής νοημοσύνης. Καθώς η τεχνητή νοημοσύνη ενσωματώνεται περισσότερο στις επιχειρηματικές λειτουργίες, υπάρχει μια αυξανόμενη ζήτηση για μοντέλα που καλύπτουν συγκεκριμένες ανάγκες, προσφέροντας βελτιωμένη ιδιωτικότητα και ασφάλεια. Αυτή η αλλαγή ευθυγραμμίζεται με τις βασικές αρχές της Μικτής προσέγγισης, η οποία δίνει έμφαση στην αποτελεσματικότητα, τη σχέση κόστους-αποτελεσματικότητας και την προσαρμοστικότητα.

Συμπερασματικά, η συνδυασμένη μέθοδος αντιπροσωπεύει ένα σημαντικό βήμα στην ανάπτυξη της τεχνητής νοημοσύνης. Συνδυάζοντας πολλά μικρότερα μοντέλα, προσφέρει μια αποτελεσματική, οικονομικά αποδοτική λύση που διατηρεί, και σε ορισμένες περιπτώσεις, ενισχύει την αφοσίωση και τη διατήρηση των χρηστών σε σύγκριση με μεγαλύτερα μοντέλα με μεγαλύτερη ένταση πόρων. Αυτή η προσέγγιση όχι μόνο αντιμετωπίζει τους πρακτικούς περιορισμούς των AI μεγάλης κλίμακας, αλλά επίσης ανοίγει νέες δυνατότητες για εφαρμογές τεχνητής νοημοσύνης σε διάφορους τομείς.

Πηγή εικόνας: Shutterstock

SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
πηγή: https://Blockchain.News/analysis/exciting-ai-efficiency-blending-smaller-models-surpasses-large-counterparts

Σφραγίδα ώρας: Ιανουάριος 18, 2024

Σφραγίδα ώρας: 21 Απριλίου 2023

Συναρπαστική απόδοση τεχνητής νοημοσύνης: Η ανάμειξη μικρότερων μοντέλων ξεπερνά τα μεγάλα αντίστοιχα

Αναδημοσίευση από τον Πλάτωνα

Περισσότερα από Blockchain News

Το PlanetWatch συνεργάζεται με την Treedom για να ξεκινήσει την πρωτοβουλία «Stake for the Planet».

Ο πρόεδρος της SEC Gary Gensler προειδοποιεί τις εταιρείες κρυπτογράφησης

Το ΗΒ αγκαλιάζει την καινοτομία κρυπτογράφησης με πρωτοποριακό νόμο για τις χρηματοοικονομικές υπηρεσίες

Η Καλιφόρνια προτείνει κανονισμούς Crypto ATM εν μέσω αυξανόμενης απάτης

Η Bakkt επιτρέπει στους πελάτες να συναλλάσσονται με ETH σε Πλατφόρμα Ψηφιακών Περιουσιακών Στοιχείων, να κινούνται πέρα από τις προσφορές Bitcoin

Η Binance.US θα καταργήσει ορισμένα ζεύγη συναλλαγών και θα διακόψει την εξωχρηματιστηριακή συναλλαγή

Η Intel δημοσιεύει νέες προδιαγραφές υλικού Bitcoin Miner

Ο οικονομικός τρόπος του μέλλοντος, η οικοδόμηση πλούτου είναι βασικοί μοχλοί για την κατοχή κρυπτογράφησης: Δείχνει μελέτη

Η FTX Japan παρουσιάζει την απόδειξη φερεγγυότητας που βασίζεται σε Blockchain για να ενισχύσει τη διαφάνεια και την ασφάλεια

Η Αυστραλία ξεπερνά την Ασία σε εγκαταστάσεις Crypto ATM

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός