मशीन लर्निंग शीत-परमाणु प्रयोगों से परेशानी को दूर करती है - भौतिकी विश्व

मशीन लर्निंग शीत-परमाणु प्रयोगों से परेशानी को दूर करती है - भौतिकी विश्व

स्रोत नोड: 3091277


रुबिडियम एमओटी युक्त निर्वात कक्ष का फोटो, जो प्रकाशिकी और इमेजिंग प्रणालियों से घिरा हुआ है
स्वचालित समायोजन: ट्यूबिंगन समूह के रूबिडियम मैग्नेटो-ऑप्टिकल ट्रैप (एमओटी) वाले निर्वात कक्ष में एक दृश्य। एमओटी लेज़रों की आवृत्ति को एक सुदृढीकरण शिक्षण एजेंट द्वारा नियंत्रित किया जाता है। (सौजन्य: माल्टे रेनस्मिड्ट)

ठंडे परमाणु क्वांटम प्रौद्योगिकी में कई समस्याओं का समाधान करते हैं। क्वांटम कंप्यूटर चाहिए? आप एक से एक बना सकते हैं अल्ट्राकोल्ड परमाणुओं की सरणी. सुरक्षित संचार नेटवर्क के लिए क्वांटम पुनरावर्तक की आवश्यकता है? ठंडे परमाणु क्या आपने कवर किया है. जटिल संघनित-पदार्थ समस्याओं के लिए क्वांटम सिम्युलेटर के बारे में क्या ख्याल है? हां, ठंडे परमाणु वह भी कर सकते हैं.

नकारात्मक पक्ष यह है कि इनमें से कोई भी कार्य करने की आवश्यकता होती है लगभग दो नोबेल पुरस्कारों का मूल्य प्रायोगिक उपकरण का. इससे भी बदतर, गड़बड़ी के सबसे छोटे स्रोत - प्रयोगशाला के तापमान में बदलाव, एक भटका हुआ चुंबकीय क्षेत्र (ठंडे परमाणु भी बनाते हैं)। उत्कृष्ट क्वांटम मैग्नेटोमीटर), यहां तक ​​कि एक पटक दिया गया दरवाज़ा भी - लेज़रों, प्रकाशिकी, चुंबकीय कुंडलियों और इलेक्ट्रॉनिक्स की जटिल श्रृंखलाओं को अस्थिर कर सकता है जो शीत-परमाणु भौतिकी को संभव बनाते हैं।

इस जटिलता से निपटने के लिए, कोल्ड-एटम भौतिकविदों ने अपने प्रयोगों को बढ़ाने के लिए मशीन लर्निंग का उपयोग करने के तरीकों की खोज शुरू कर दी है। उदाहरण के लिए, 2018 में, ऑस्ट्रेलियन नेशनल यूनिवर्सिटी की एक टीम ने एक विकसित किया मैग्नेटो-ऑप्टिकल जाल में परमाणुओं को लोड करने के लिए मशीन-अनुकूलित दिनचर्या (एमओटी) जो शीत-परमाणु प्रयोगों के लिए प्रारंभिक बिंदु बनाते हैं। 2019 में, जापान में RIKEN के एक समूह ने मशीन लर्निंग का उपयोग करके, शीतलन प्रक्रिया के बाद के चरण में इस सिद्धांत को लागू किया परमाणुओं को ठंडा करने के नए और प्रभावी तरीकों की पहचान करें पूर्ण शून्य से एक डिग्री ऊपर के तापमान तक, जहां वे एक क्वांटम अवस्था में प्रवेश करते हैं जिसे बोस-आइंस्टीन कंडेनसेट (बीईसी) के रूप में जाना जाता है।

मशीन को यह करने दो

इस प्रवृत्ति के नवीनतम विकास में, भौतिकविदों की दो स्वतंत्र टीमों ने दिखाया है कि मशीन लर्निंग का एक रूप जिसे सुदृढीकरण सीखने के रूप में जाना जाता है, कोल्ड-एटम सिस्टम को व्यवधानों से निपटने में मदद कर सकता है।

"हमारी प्रयोगशाला में, हमने पाया कि हमारी बीईसी-उत्पादक प्रणाली काफी अस्थिर थी, जैसे कि हमारे पास दिन में केवल कुछ घंटों के लिए उचित गुणवत्ता के बीईसी का उत्पादन करने की क्षमता थी," बताते हैं। निक मिल्सन, कनाडा के अल्बर्टा विश्वविद्यालय में पीएचडी छात्र, जिन्होंने नेतृत्व किया परियोजनाओं में से एक. इस प्रणाली को हाथ से अनुकूलित करना चुनौतीपूर्ण साबित हुआ: "आपके पास जटिल और आम तौर पर कठिन भौतिकी पर आधारित एक प्रक्रिया है, और यह एक प्रयोगात्मक उपकरण द्वारा मिश्रित है जिसमें स्वाभाविक रूप से कुछ हद तक अपूर्णता होने वाली है," मिल्सन कहते हैं। "यही कारण है कि कई समूहों ने मशीन लर्निंग की समस्या से निपटा है, और एक सुसंगत और प्रतिक्रियाशील नियंत्रक के निर्माण की समस्या से निपटने के लिए हम सुदृढीकरण सीखने की ओर क्यों रुख करते हैं।"

सुदृढीकरण सीखना (आरएल) अन्य मशीन लर्निंग रणनीतियों से अलग काम करता है जो लेबल किए गए या बिना लेबल वाले इनपुट डेटा लेते हैं और आउटपुट की भविष्यवाणी करने के लिए इसका उपयोग करते हैं। इसके बजाय, आरएल का लक्ष्य वांछनीय परिणामों को सुदृढ़ करके और खराब परिणामों को दंडित करके एक प्रक्रिया को अनुकूलित करना है।

अपने अध्ययन में, मिल्सन और सहकर्मियों ने रुबिडियम परमाणुओं के बीईसी बनाने के लिए अपने उपकरण में 30 मापदंडों को समायोजित करने के लिए अभिनेता-आलोचक तंत्रिका नेटवर्क नामक एक आरएल एजेंट को अनुमति दी। उन्होंने एजेंट को पिछले बीईसी-निर्माण चक्र के दौरान पहचाने गए 30 पर्यावरणीय पैरामीटर भी प्रदान किए। मिल्सन बताते हैं, "कोई अभिनेता को निर्णय-निर्माता के रूप में सोच सकता है, जो यह पता लगाने की कोशिश कर रहा है कि विभिन्न पर्यावरणीय उत्तेजनाओं के जवाब में कैसे कार्य किया जाए।" “आलोचक यह पता लगाने की कोशिश कर रहा है कि अभिनेता की हरकतें कितना अच्छा प्रदर्शन करेंगी। इसका काम अनिवार्य रूप से संभावित कार्यों की 'अच्छाई' या 'बुराई' का आकलन करके अभिनेता को प्रतिक्रिया प्रदान करना है।

पिछले प्रायोगिक परीक्षणों के डेटा पर अपने आरएल एजेंट को प्रशिक्षित करने के बाद, अल्बर्टा भौतिकविदों ने पाया कि आरएल-निर्देशित नियंत्रक ने रुबिडियम परमाणुओं को चुंबकीय जाल में लोड करने में लगातार मनुष्यों से बेहतर प्रदर्शन किया। मिल्सन का कहना है कि मुख्य कमी प्रशिक्षण डेटा एकत्र करने में लगने वाला समय था। "अगर हम प्रतिदीप्ति-आधारित इमेजिंग जैसी एक गैर-विनाशकारी इमेजिंग तकनीक पेश कर सकते हैं, तो हम अनिवार्य रूप से सिस्टम को हर समय डेटा एकत्र कर सकते हैं, इससे कोई फर्क नहीं पड़ता कि वर्तमान में सिस्टम का उपयोग कौन कर रहा है, या किस उद्देश्य के लिए," वह बताते हैं। भौतिकी की दुनिया.

क्रमशः

एक अलग काम में, भौतिकविदों का नेतृत्व किया वैलेन्टिन वोल्चकोव मैक्स प्लैंक इंस्टीट्यूट फॉर इंटेलिजेंट सिस्टम्स और जर्मनी के टुबिंगन विश्वविद्यालय के, अपने ट्युबिंगन सहयोगी के साथ एंड्रियास गुंथर, एक अलग दृष्टिकोण अपनाया। दर्जनों प्रायोगिक मापदंडों को अनुकूलित करने के लिए अपने आरएल एजेंट को प्रशिक्षित करने के बजाय, उन्होंने केवल दो पर ध्यान केंद्रित किया: एमओटी का चुंबकीय क्षेत्र ढाल, और इसमें रूबिडियम परमाणुओं को ठंडा करने और फंसाने के लिए उपयोग की जाने वाली लेजर प्रकाश की आवृत्ति।

लेज़र आवृत्ति का इष्टतम मान आम तौर पर वह होता है जो सबसे बड़ी संख्या में परमाणु उत्पन्न करता है N सबसे कम तापमान पर T। हालाँकि, यह इष्टतम मूल्य परिवर्तन चूँकि परमाणुओं और लेज़र प्रकाश के बीच परस्पर क्रिया के कारण तापमान गिरता है। इसलिए टुबिंगन टीम ने अपने आरएल एजेंट को 25-सेकंड लंबे एमओटी लोडिंग चक्र के दौरान 1.5 अनुक्रमिक समय चरणों में मापदंडों को समायोजित करने की अनुमति दी, और वांछित मूल्य के जितना संभव हो उतना करीब पहुंचने के लिए इसे "पुरस्कृत" किया। एन/टी अंत में, जैसा कि प्रतिदीप्ति इमेजिंग द्वारा मापा जाता है।

जबकि आरएल एजेंट एमओटी में परमाणुओं को ठंडा करने के लिए किसी भी पूर्व-अज्ञात रणनीति के साथ नहीं आया - "एक काफी उबाऊ परिणाम", वोल्चकोव मजाक करता है - इसने प्रयोगात्मक उपकरण को और अधिक मजबूत बना दिया। "अगर हमारे नमूने के समय के पैमाने पर कुछ गड़बड़ी है, तो एजेंट को उस पर प्रतिक्रिया करने में सक्षम होना चाहिए अगर उसे तदनुसार प्रशिक्षित किया जाए," वे कहते हैं। उनका कहना है कि इस तरह के स्वचालित समायोजन, पोर्टेबल क्वांटम डिवाइस बनाने के लिए महत्वपूर्ण होंगे, जिनकी देखभाल "पीएचडी छात्र 24-7 नहीं कर सकते"।

जटिल प्रणालियों के लिए एक उपकरण

वोल्चकोव का मानना ​​है कि आरएल का शीत-परमाणु भौतिकी में भी व्यापक अनुप्रयोग हो सकता है। "मेरा दृढ़ विश्वास है कि सुदृढीकरण सीखने में स्वतंत्रता की पर्याप्त डिग्री के साथ अल्ट्राकोल्ड क्वांटम गैस प्रयोगों के नियंत्रण पर लागू होने पर संचालन के नए तरीके और काउंटर-सहज ज्ञान युक्त नियंत्रण अनुक्रम उत्पन्न करने की क्षमता है," वह बताते हैं। भौतिकी की दुनिया. “यह अधिक जटिल परमाणु प्रजातियों और अणुओं के लिए विशेष रूप से प्रासंगिक है। अंततः, नियंत्रण के इन नए तरीकों का विश्लेषण अधिक विदेशी अल्ट्राकोल्ड गैसों को नियंत्रित करने वाले भौतिक सिद्धांतों पर प्रकाश डाल सकता है।

मिल्सन भी तकनीक की क्षमता को लेकर वैसे ही उत्साहित हैं। वे कहते हैं, "परमाणु भौतिकी के सभी क्षेत्रों में उपयोग के मामले संभवतः अंतहीन हैं।" "ऑप्टिकल चिमटी में परमाणुओं को लोड करने के अनुकूलन से लेकर, क्वांटम जानकारी के इष्टतम भंडारण और पुनर्प्राप्ति के लिए क्वांटम मेमोरी में प्रोटोकॉल डिजाइन करने तक, मशीन लर्निंग परमाणु और क्वांटम भौतिकी में पाए जाने वाले इन जटिल, कई-शरीर परिदृश्यों के लिए बहुत उपयुक्त लगती है।"

अल्बर्टा टीम का काम प्रकाशित हुआ है मशीन लर्निंग: विज्ञान और प्रौद्योगिकी. टुबिंगन टीम का काम एक में दिखाई देता है arXiv प्रीप्रिंट.

  • वैलेंटाइन वोल्चकोव की संबद्धता और टुबिंगन प्रयोग के विवरण को स्पष्ट करने के लिए इस लेख को 31 जनवरी 2024 को संशोधित किया गया था।

समय टिकट:

से अधिक भौतिकी की दुनिया