Εάν δεν το γνωρίζατε ήδη

Εάν δεν το γνωρίζατε ήδη

Κόμβος πηγής: 2969387

Σύσταση βασισμένη σε βαθιά ενισχυτική μάθηση (DRR) google
Η σύσταση είναι ζωτικής σημασίας τόσο στον ακαδημαϊκό χώρο όσο και στη βιομηχανία και προτείνονται διάφορες τεχνικές, όπως το συνεργατικό φιλτράρισμα βάσει περιεχομένου, η παραγοντοποίηση μήτρας, η λογιστική παλινδρόμηση, οι μηχανές παραγοντοποίησης, τα νευρωνικά δίκτυα και οι ληστές πολλαπλών όπλων. Ωστόσο, οι περισσότερες από τις προηγούμενες μελέτες υποφέρουν από δύο περιορισμούς: (1) θεωρώντας τη σύσταση ως στατική διαδικασία και αγνοώντας τη δυναμική διαδραστική φύση μεταξύ των χρηστών και των συστημάτων συστάσεων, (2) εστίαση στην άμεση ανάδραση των προτεινόμενων στοιχείων και παραμέληση της μακράς διάρκειας - ανταμοιβές θητείας. Για να αντιμετωπίσουμε τους δύο περιορισμούς, σε αυτό το έγγραφο προτείνουμε ένα νέο πλαίσιο συστάσεων που βασίζεται στη μάθηση βαθιάς ενίσχυσης, που ονομάζεται DRR. Το πλαίσιο DRR αντιμετωπίζει τη σύσταση ως μια διαδοχική διαδικασία λήψης αποφάσεων και υιοθετεί ένα σχήμα ενίσχυσης μάθησης «Actor-Critic» για να μοντελοποιήσει τις αλληλεπιδράσεις μεταξύ των χρηστών και των συστημάτων συστάσεων, το οποίο μπορεί να λάβει υπόψη τόσο τη δυναμική προσαρμογή όσο και τις μακροπρόθεσμες ανταμοιβές. Επιπλέον, μια ενότητα αναπαράστασης κατάστασης είναι ενσωματωμένη στο DRR, η οποία μπορεί να καταγράψει ρητά τις αλληλεπιδράσεις μεταξύ στοιχείων και χρηστών. Αναπτύχθηκαν τρεις δομές στιγμιότυπου. Εκτεταμένα πειράματα σε τέσσερα σύνολα δεδομένων πραγματικού κόσμου διεξάγονται τόσο στις ρυθμίσεις αξιολόγησης εκτός σύνδεσης όσο και στο διαδίκτυο. Τα πειραματικά αποτελέσματα καταδεικνύουν ότι η προτεινόμενη μέθοδος DRR υπερτερεί των ανταγωνιστών τελευταίας τεχνολογίας. …

Βαθιά μάθηση google
Η βαθιά μάθηση είναι ένα σύνολο αλγορίθμων στη μηχανική μάθηση που προσπαθούν να μοντελοποιήσουν αφαιρέσεις υψηλού επιπέδου σε δεδομένα χρησιμοποιώντας αρχιτεκτονικές που αποτελούνται από πολλαπλούς μη γραμμικούς μετασχηματισμούς. Η βαθιά μάθηση είναι μέρος μιας ευρύτερης οικογένειας μεθόδων μηχανικής μάθησης που βασίζονται σε αναπαραστάσεις εκμάθησης. Μια παρατήρηση (π.χ. μια εικόνα) μπορεί να αναπαρασταθεί με πολλούς τρόπους (π.χ. ένα διάνυσμα εικονοστοιχείων), αλλά ορισμένες αναπαραστάσεις διευκολύνουν την εκμάθηση εργασιών ενδιαφέροντος (π.χ. είναι αυτή η εικόνα ενός ανθρώπινου προσώπου;) από παραδείγματα, και η έρευνα σε αυτόν τον τομέα επιχειρεί να ορίσει τι κάνει καλύτερες αναπαραστάσεις και πώς να δημιουργηθούν μοντέλα για την εκμάθηση αυτών των αναπαραστάσεων. Διάφορες αρχιτεκτονικές βαθιάς μάθησης, όπως τα βαθιά νευρωνικά δίκτυα, τα συνελικτικά βαθιά νευρωνικά δίκτυα και τα δίκτυα βαθιάς πεποίθησης έχουν εφαρμοστεί σε πεδία όπως η όραση υπολογιστή, η αυτόματη αναγνώριση ομιλίας, η επεξεργασία φυσικής γλώσσας και η αναγνώριση σήματος μουσικής/ηχητικού σήματος, όπου έχει αποδειχθεί ότι παράγουν κατάσταση -αποτελέσματα τελευταίας τεχνολογίας σε διάφορες εργασίες. …

Κεντρική Εκμάθηση Συντονισμού (CCL) google
Λόγω της ταχείας ανάπτυξης των τεχνικών βαθιάς νευρωνικών δικτύων (DNN) και της εμφάνισης βάσεων δεδομένων προσώπων μεγάλης κλίμακας, η αναγνώριση προσώπου έχει επιτύχει μεγάλη επιτυχία τα τελευταία χρόνια. Κατά τη διάρκεια της εκπαιδευτικής διαδικασίας του DNN, τα χαρακτηριστικά προσώπου και τα διανύσματα ταξινόμησης που θα μάθουν θα αλληλεπιδρούν μεταξύ τους, ενώ η κατανομή των χαρακτηριστικών προσώπου θα επηρεάσει σε μεγάλο βαθμό την κατάσταση σύγκλισης του δικτύου και τον υπολογισμό της ομοιότητας προσώπου στο στάδιο της δοκιμής. Σε αυτή την εργασία, διατυπώνουμε από κοινού την εκμάθηση των χαρακτηριστικών του προσώπου και των διανυσμάτων ταξινόμησης και προτείνουμε μια απλή αλλά αποτελεσματική μέθοδο κεντρικής μάθησης συντεταγμένων (CCL), η οποία επιβάλλει τα χαρακτηριστικά να διασκορπίζονται στον χώρο των συντεταγμένων, διασφαλίζοντας παράλληλα ότι τα διανύσματα ταξινόμησης βρίσκονται πάνω. μια υπερσφαίρα. Ένα προσαρμοστικό γωνιακό περιθώριο προτείνεται περαιτέρω για την ενίσχυση της ικανότητας διάκρισης των χαρακτηριστικών του προσώπου. Διεξάγονται εκτεταμένα πειράματα σε έξι σημεία αναφοράς προσώπων, συμπεριλαμβανομένων εκείνων που έχουν μεγάλο χάσμα ηλικίας και σκληρά αρνητικά δείγματα. Εκπαιδευμένο μόνο στο μικρής κλίμακας σύνολο δεδομένων CASIA Webface με 460K εικόνες προσώπων από περίπου 10 θέματα, το μοντέλο μας CCL επιδεικνύει υψηλή αποτελεσματικότητα και γενικότητα, παρουσιάζοντας σταθερά ανταγωνιστική απόδοση και στις έξι βάσεις δεδομένων αναφοράς. …

Fast-Node2Vec google
Το Node2Vec είναι μια υπερσύγχρονη μέθοδος εκμάθησης χαρακτηριστικών γενικής χρήσης για ανάλυση δικτύου. Ωστόσο, οι τρέχουσες λύσεις δεν μπορούν να εκτελέσουν το Node2Vec σε γραφήματα μεγάλης κλίμακας με δισεκατομμύρια κορυφές και ακμές, που είναι κοινά σε εφαρμογές του πραγματικού κόσμου. Το υπάρχον κατανεμημένο Node2Vec στο Spark επιβαρύνει σημαντικά τον χώρο και τον χρόνο. Εξαντλείται η μνήμη ακόμη και για γραφήματα μεσαίου μεγέθους με εκατομμύρια κορυφές. Επιπλέον, λαμβάνει υπόψη το πολύ 30 άκρες για κάθε κορυφή στη δημιουργία τυχαίων βημάτων, προκαλώντας κακή ποιότητα αποτελέσματος. Σε αυτό το άρθρο, προτείνουμε το Fast-Node2Vec, μια οικογένεια αποτελεσματικών αλγορίθμων τυχαίας βάδισης Node2Vec σε ένα πλαίσιο υπολογισμού γραφήματος τύπου Pregel. Το Fast-Node2Vec υπολογίζει τις πιθανότητες μετάβασης κατά τη διάρκεια τυχαίων περιπάτων για να μειώσει την κατανάλωση χώρου στη μνήμη και την επιβάρυνση του υπολογισμού για γραφήματα μεγάλης κλίμακας. Το σχήμα Pregel αποφεύγει την επιβάρυνση χώρου και χρόνου των δομών RDD μόνο για ανάγνωση και των λειτουργιών τυχαίας αναπαραγωγής του Spark. Επιπλέον, προτείνουμε έναν αριθμό τεχνικών βελτιστοποίησης για περαιτέρω μείωση των επιβαρύνσεων υπολογισμού για δημοφιλείς κορυφές με μεγάλες μοίρες. Η εμπειρική αξιολόγηση δείχνει ότι το Fast-Node2Vec είναι ικανό να υπολογίζει το Node2Vec σε γραφήματα με δισεκατομμύρια κορυφές και ακμές σε ένα σύμπλεγμα μηχανών μεσαίου μεγέθους. Σε σύγκριση με το Spark-Node2Vec, το Fast-Node2Vec επιτυγχάνει ταχύτητες 7.7–122x. …

Σφραγίδα ώρας:

Περισσότερα από Αναλυτικά