Η μηχανική μάθηση απομακρύνει την ταλαιπωρία από πειράματα ψυχρού ατόμου - Physics World

Η μηχανική μάθηση απομακρύνει την ταλαιπωρία από πειράματα ψυχρού ατόμου - Physics World

Κόμβος πηγής: 3091277


Φωτογραφία του θαλάμου κενού που περιέχει το ρουβίδιο MOT, που περιβάλλεται από οπτικά συστήματα και συστήματα απεικόνισης
Αυτόματες ρυθμίσεις: Άποψη στο θάλαμο κενού που περιέχει τη μαγνητοοπτική παγίδα ρουβιδίου (MOT) της ομάδας Tübingen. Η συχνότητα των λέιζερ MOT ελέγχεται από έναν ενισχυτικό παράγοντα εκμάθησης. (Ευγενική προσφορά: Malte Reinschmidt)

Τα ψυχρά άτομα λύνουν πολλά προβλήματα στην κβαντική τεχνολογία. Θέλετε έναν κβαντικό υπολογιστή; Μπορείτε να φτιάξετε ένα από ένα συστοιχία υπερψυχρών ατόμων. Χρειάζεστε έναν κβαντικό επαναλήπτη για ένα ασφαλές δίκτυο επικοινωνιών; Ψυχρά άτομα έχεις καλυφθεί. Τι θα λέγατε για έναν κβαντικό προσομοιωτή για περίπλοκα προβλήματα συμπυκνωμένης ύλης; Ναι, ψυχρά άτομα μπορεί να το κάνει και αυτό.

Το μειονέκτημα είναι ότι χρειάζεται να κάνεις οποιοδήποτε από αυτά τα πράγματα περίπου δύο βραβεία Νόμπελ της πειραματικής συσκευής. Ακόμη χειρότερα, οι πιο μικροσκοπικές πηγές αναστάτωσης - μια αλλαγή στη θερμοκρασία του εργαστηρίου, ένα αδέσποτο μαγνητικό πεδίο (τα ψυχρά άτομα προκαλούν επίσης εξαιρετικά κβαντικά μαγνητόμετρα), ακόμη και μια πόρτα που χτυπάει - μπορεί να ταράξει τις περίπλοκες συστοιχίες λέιζερ, οπτικών, μαγνητικών πηνίων και ηλεκτρονικών που καθιστούν δυνατή τη φυσική του ψυχρού ατόμου.

Για να αντιμετωπίσουν αυτή την πολυπλοκότητα, οι φυσικοί ψυχρού ατόμου έχουν αρχίσει να εξερευνούν τρόπους χρήσης μηχανικής μάθησης για να ενισχύσουν τα πειράματά τους. Το 2018, για παράδειγμα, μια ομάδα στο Εθνικό Πανεπιστήμιο της Αυστραλίας ανέπτυξε ένα Ρουτίνα βελτιστοποιημένη για τη μηχανή για τη φόρτωση ατόμων στις μαγνητο-οπτικές παγίδες (MOT) που αποτελούν το σημείο εκκίνησης για πειράματα ψυχρού ατόμου. Το 2019, μια ομάδα στο RIKEN στην Ιαπωνία εφάρμοσε αυτήν την αρχή σε μεταγενέστερο στάδιο της διαδικασίας ψύξης, χρησιμοποιώντας μηχανική μάθηση για να να εντοπίσει νέους και αποτελεσματικούς τρόπους ψύξης ατόμων σε θερμοκρασίες ένα κλάσμα ενός βαθμού πάνω από το απόλυτο μηδέν, όπου εισέρχονται σε μια κβαντική κατάσταση γνωστή ως συμπύκνωμα Bose-Einstein (BEC).

Αφήστε το μηχάνημα να το κάνει

Στην τελευταία εξέλιξη αυτής της τάσης, δύο ανεξάρτητες ομάδες φυσικών έχουν δείξει ότι μια μορφή μηχανικής μάθησης γνωστή ως ενισχυτική μάθηση μπορεί να βοηθήσει τα συστήματα ψυχρού ατόμου να χειριστούν τις διακοπές.

«Στο εργαστήριό μας, διαπιστώσαμε ότι το σύστημα παραγωγής BEC μας ήταν αρκετά ασταθές, έτσι ώστε είχαμε τη δυνατότητα να παράγουμε BEC λογικής ποιότητας μόνο για λίγες ώρες μέσα στην ημέρα», εξηγεί. Νικ Μίλσον, διδάκτορας στο Πανεπιστήμιο της Αλμπέρτα του Καναδά που ηγήθηκε ένα από τα έργα. Η βελτιστοποίηση αυτού του συστήματος με το χέρι αποδείχθηκε πρόκληση: «Έχετε μια διαδικασία που υποστηρίζεται από περίπλοκη και γενικά δυσεπίλυτη φυσική, και αυτό συνδυάζεται με μια πειραματική συσκευή που φυσικά θα έχει κάποιο βαθμό ατέλειας», λέει ο Milson. «Αυτός είναι ο λόγος που πολλές ομάδες έχουν αντιμετωπίσει το πρόβλημα με τη μηχανική μάθηση και γιατί στρεφόμαστε στην ενισχυτική μάθηση για να αντιμετωπίσουμε το πρόβλημα της δημιουργίας ενός συνεπούς και αντιδραστικού ελεγκτή».

Η ενισχυτική μάθηση (RL) λειτουργεί διαφορετικά από άλλες στρατηγικές μηχανικής μάθησης που λαμβάνουν δεδομένα εισόδου με ετικέτα ή χωρίς ετικέτα και τα χρησιμοποιούν για την πρόβλεψη των αποτελεσμάτων. Αντίθετα, το RL στοχεύει στη βελτιστοποίηση μιας διαδικασίας ενισχύοντας τα επιθυμητά αποτελέσματα και τιμωρώντας τα φτωχά.

Στη μελέτη τους, ο Milson και οι συνεργάτες του επέτρεψαν σε έναν πράκτορα RL που ονομάζεται νευρωνικό δίκτυο δραστών να προσαρμόσει 30 παραμέτρους στη συσκευή τους για τη δημιουργία BEC ατόμων ρουβιδίου. Επίσης, προμήθευσαν τον παράγοντα με 30 περιβαλλοντικές παραμέτρους που ανιχνεύτηκαν κατά τον προηγούμενο κύκλο δημιουργίας BEC. «Μπορεί κανείς να σκεφτεί τον ηθοποιό ως εκείνον που λαμβάνει αποφάσεις, προσπαθώντας να καταλάβει πώς να ενεργήσει ως απάντηση σε διαφορετικά περιβαλλοντικά ερεθίσματα», εξηγεί ο Milson. «Ο κριτικός προσπαθεί να καταλάβει πόσο καλά θα αποδώσουν οι πράξεις του ηθοποιού. Η δουλειά του είναι ουσιαστικά να παρέχει ανατροφοδότηση στον ηθοποιό αξιολογώντας το «καλό» ή το «κακό» των πιθανών ενεργειών που γίνονται».

Αφού εκπαίδευσαν τον πράκτορά τους RL σε δεδομένα από προηγούμενες πειραματικές δοκιμές, οι φυσικοί της Αλμπέρτα διαπίστωσαν ότι ο ελεγκτής που καθοδηγείται από RL ξεπερνούσε σταθερά τους ανθρώπους στη φόρτωση ατόμων ρουβιδίου σε μια μαγνητική παγίδα. Το κύριο μειονέκτημα, λέει ο Milson, ήταν ο χρόνος που απαιτείται για τη συλλογή δεδομένων εκπαίδευσης. «Εάν μπορούσαμε να εισαγάγουμε μια μη καταστροφική τεχνική απεικόνισης, όπως η απεικόνιση με βάση το φθορισμό, θα μπορούσαμε ουσιαστικά να έχουμε το σύστημα να συλλέγει δεδομένα όλη την ώρα, ανεξάρτητα από το ποιος χρησιμοποιούσε αυτήν τη στιγμή το σύστημα ή για ποιο σκοπό», λέει. Κόσμος Φυσικής.

Βήμα βήμα

Σε μια ξεχωριστή εργασία, οι φυσικοί με επικεφαλής τον Valentin Volchkov του Ινστιτούτου Max Planck για Ευφυή Συστήματα και του Πανεπιστημίου του Tübingen, Γερμανία, μαζί με τον συνάδελφό του Tübingen Andreas Günther, ακολούθησε διαφορετική προσέγγιση. Αντί να εκπαιδεύσουν τον πράκτορά τους RL για να βελτιστοποιήσουν δεκάδες πειραματικές παραμέτρους, εστίασαν μόνο σε δύο: τη βαθμίδα μαγνητικού πεδίου του MOT και τη συχνότητα του φωτός λέιζερ που χρησιμοποιείται για την ψύξη και την παγίδευση ατόμων ρουβιδίου σε αυτό.

Η βέλτιστη τιμή της συχνότητας λέιζερ είναι γενικά εκείνη που παράγει τον μεγαλύτερο αριθμό ατόμων N στη χαμηλότερη θερμοκρασία T. Ωστόσο, αυτό οι βέλτιστες αλλαγές τιμών καθώς η θερμοκρασία πέφτει λόγω των αλληλεπιδράσεων μεταξύ των ατόμων και του φωτός λέιζερ. Ως εκ τούτου, η ομάδα του Tübingen επέτρεψε στον πράκτορά της RL να προσαρμόσει τις παραμέτρους σε 25 διαδοχικά χρονικά βήματα κατά τη διάρκεια ενός κύκλου φόρτωσης MOT διάρκειας 1.5 δευτερολέπτου και τον «αντάμειψε» για να πλησιάσει όσο το δυνατόν περισσότερο την επιθυμητή τιμή Ν / Τ στο τέλος, όπως μετρήθηκε με απεικόνιση φθορισμού.

Ενώ ο πράκτορας RL δεν βρήκε καμία προηγουμένως άγνωστη στρατηγική για την ψύξη των ατόμων στο MOT - "ένα αρκετά βαρετό αποτέλεσμα", αστειεύεται ο Volchkov - έκανε την πειραματική συσκευή πιο στιβαρή. "Εάν υπάρχει κάποια διαταραχή στη χρονική κλίμακα της δειγματοληψίας μας, τότε ο πράκτορας θα πρέπει να είναι σε θέση να αντιδράσει σε αυτό εάν έχει εκπαιδευτεί ανάλογα", λέει. Τέτοιες αυτόματες προσαρμογές, προσθέτει, θα είναι ζωτικής σημασίας για τη δημιουργία φορητών κβαντικών συσκευών που «δεν μπορούν οι διδακτορικοί φοιτητές να τους φροντίζουν 24-7».

Ένα εργαλείο για πολύπλοκα συστήματα

Ο Volchkov πιστεύει ότι το RL θα μπορούσε επίσης να έχει ευρύτερες εφαρμογές στη φυσική του ψυχρού ατόμου. «Πιστεύω ακράδαντα ότι η ενισχυτική μάθηση έχει τη δυνατότητα να παράγει νέους τρόπους λειτουργίας και αντι-διαισθητικές ακολουθίες ελέγχου όταν εφαρμόζεται στον έλεγχο πειραμάτων υπερψυχρού κβαντικού αερίου με επαρκείς βαθμούς ελευθερίας», λέει. Κόσμος Φυσικής. «Αυτό είναι ιδιαίτερα σημαντικό για πιο πολύπλοκα ατομικά είδη και μόρια. Τελικά, η ανάλυση αυτών των νέων τρόπων ελέγχου μπορεί να ρίξει φως στις φυσικές αρχές που διέπουν τα πιο εξωτικά υπερψυχρά αέρια».

Ο Milson είναι εξίσου ενθουσιασμένος με τις δυνατότητες της τεχνικής. «Οι περιπτώσεις χρήσης είναι πιθανώς ατελείωτες, καλύπτοντας όλους τους τομείς της ατομικής φυσικής», λέει. «Από τη βελτιστοποίηση της φόρτωσης ατόμων σε οπτικά τσιμπιδάκια, μέχρι το σχεδιασμό πρωτοκόλλων στην κβαντική μνήμη για βέλτιστη αποθήκευση και ανάκτηση κβαντικών πληροφοριών, η μηχανική μάθηση φαίνεται πολύ κατάλληλη σε αυτά τα περίπλοκα σενάρια πολλών σωμάτων που βρίσκονται στην ατομική και την κβαντική φυσική».

Η δουλειά της ομάδας της Αλμπέρτα δημοσιεύεται στο Μηχανική Μάθηση: Επιστήμη και Τεχνολογία. Το έργο της ομάδας Tübingen εμφανίζεται σε ένα arXiv προεκτύπωση.

  • Αυτό το άρθρο τροποποιήθηκε στις 31 Ιανουαρίου 2024 για να διευκρινιστούν οι σχέσεις του Valentin Volchkov και οι λεπτομέρειες του πειράματος Tübingen.

Σφραγίδα ώρας:

Περισσότερα από Κόσμος Φυσικής