মেশিন লার্নিং ঠান্ডা-পরমাণু পরীক্ষা-নিরীক্ষার ঝামেলা থেকে বেরিয়ে আসে - পদার্থবিজ্ঞান বিশ্ব

মেশিন লার্নিং ঠান্ডা-পরমাণু পরীক্ষা-নিরীক্ষার ঝামেলা থেকে বেরিয়ে আসে - পদার্থবিজ্ঞান বিশ্ব

উত্স নোড: 3091277


অপটিক্স এবং ইমেজিং সিস্টেম দ্বারা বেষ্টিত রুবিডিয়াম এমওটি ধারণকারী ভ্যাকুয়াম চেম্বারের ছবি
স্বয়ংক্রিয় সমন্বয়: টিউবিনজেন গ্রুপের রুবিডিয়াম ম্যাগনেটো-অপটিক্যাল ট্র্যাপ (এমওটি) ধারণকারী ভ্যাকুয়াম চেম্বারের একটি দৃশ্য। এমওটি লেজারের ফ্রিকোয়েন্সি একটি শক্তিবৃদ্ধি শেখার এজেন্ট দ্বারা নিয়ন্ত্রিত হয়। (সৌজন্যে: Malte Reinschmidt)

ঠান্ডা পরমাণু কোয়ান্টাম প্রযুক্তিতে অনেক সমস্যার সমাধান করে। একটি কোয়ান্টাম কম্পিউটার চান? আপনি একটি থেকে একটি করতে পারেন আল্ট্রাকোল্ড পরমাণুর অ্যারে. একটি নিরাপদ যোগাযোগ নেটওয়ার্কের জন্য একটি কোয়ান্টাম রিপিটার প্রয়োজন? ঠান্ডা পরমাণু আপনি আচ্ছাদিত আছে. জটিল ঘনীভূত বিষয় সমস্যার জন্য একটি কোয়ান্টাম সিমুলেটর সম্পর্কে কিভাবে? হ্যাঁ, ঠান্ডা পরমাণু এটাও করতে পারেন।

নেতিবাচক দিক হল যে এই জিনিসগুলির যে কোনওটি করা প্রয়োজন প্রায় দুটি নোবেল পুরস্কারের মূল্য পরীক্ষামূলক যন্ত্রপাতি। সবচেয়ে খারাপ, বিপর্যয়ের ক্ষুদ্রতম উত্স - পরীক্ষাগারের তাপমাত্রার পরিবর্তন, একটি বিপথগামী চৌম্বক ক্ষেত্র (ঠান্ডা পরমাণুও তৈরি করে চমৎকার কোয়ান্টাম ম্যাগনেটোমিটার), এমনকি একটি স্ল্যামড দরজা - লেজার, অপটিক্স, চৌম্বক কয়েল এবং ইলেকট্রনিক্সের জটিল অ্যারেগুলিকে অস্থির করতে পারে যা ঠান্ডা-পরমাণু পদার্থবিদ্যাকে সম্ভব করে তোলে।

এই জটিলতার সাথে মোকাবিলা করার জন্য, ঠান্ডা-পরমাণু পদার্থবিদরা তাদের পরীক্ষা-নিরীক্ষা বাড়ানোর জন্য মেশিন লার্নিং ব্যবহার করার উপায়গুলি অন্বেষণ শুরু করেছেন। 2018 সালে, উদাহরণস্বরূপ, অস্ট্রেলিয়ান ন্যাশনাল ইউনিভার্সিটির একটি দল একটি বিকাশ করেছে ম্যাগনেটো-অপটিক্যাল ফাঁদে পরমাণু লোড করার জন্য মেশিন-অপ্টিমাইজ করা রুটিন (MOTs) যা ঠান্ডা-পরমাণু পরীক্ষাগুলির জন্য সূচনা বিন্দু গঠন করে। 2019 সালে, জাপানের RIKEN-এ একটি গ্রুপ এই নীতিটি শীতল প্রক্রিয়ার পরবর্তী পর্যায়ে প্রয়োগ করে, মেশিন লার্নিং ব্যবহার করে পরমাণু শীতল করার নতুন এবং কার্যকর উপায় সনাক্ত করুন তাপমাত্রায় পরম শূন্যের উপরে একটি ডিগ্রির একটি ভগ্নাংশ, যেখানে তারা বোস-আইনস্টাইন কনডেনসেট (BEC) নামে পরিচিত একটি কোয়ান্টাম অবস্থায় প্রবেশ করে।

মেশিন এটা করতে দিন

এই প্রবণতার সর্বশেষ বিকাশে, পদার্থবিদদের দুটি স্বাধীন দল দেখিয়েছে যে মেশিন লার্নিং এর একটি ফর্ম যা রিইনফোর্সমেন্ট লার্নিং নামে পরিচিত, ঠান্ডা-পরমাণু সিস্টেমগুলিকে বাধাগুলি পরিচালনা করতে সাহায্য করতে পারে।

"আমাদের পরীক্ষাগারে, আমরা দেখতে পেলাম যে আমাদের BEC-উৎপাদন ব্যবস্থা মোটামুটি অস্থির ছিল, যেমন আমাদের শুধুমাত্র দিনের কয়েক ঘন্টার জন্য যুক্তিসঙ্গত মানের BEC তৈরি করার ক্ষমতা ছিল," ব্যাখ্যা করে নিক মিলসন, কানাডার আলবার্টা বিশ্ববিদ্যালয়ের একজন পিএইচডি ছাত্র যিনি নেতৃত্ব দেন প্রকল্পগুলির মধ্যে একটি. হাত দ্বারা এই সিস্টেমটি অপ্টিমাইজ করা চ্যালেঞ্জিং প্রমাণিত হয়েছে: "আপনার কাছে জটিল এবং সাধারণত জটিল পদার্থবিদ্যা দ্বারা আবদ্ধ একটি পদ্ধতি রয়েছে, এবং এটি একটি পরীক্ষামূলক যন্ত্রপাতি দ্বারা সংমিশ্রিত যা স্বাভাবিকভাবেই কিছুটা অপূর্ণতা থাকতে চলেছে," মিলসন বলেছেন। "এ কারণেই অনেক গোষ্ঠী মেশিন লার্নিং দিয়ে সমস্যাটি মোকাবেলা করেছে এবং কেন আমরা একটি সামঞ্জস্যপূর্ণ এবং প্রতিক্রিয়াশীল নিয়ামক তৈরির সমস্যা মোকাবেলা করার জন্য শক্তিবৃদ্ধি শিক্ষার দিকে ফিরে যাই।"

রিইনফোর্সমেন্ট লার্নিং (RL) অন্যান্য মেশিন লার্নিং কৌশলগুলির থেকে আলাদাভাবে কাজ করে যা লেবেলযুক্ত বা লেবেলবিহীন ইনপুট ডেটা গ্রহণ করে এবং আউটপুটগুলির পূর্বাভাস দিতে এটি ব্যবহার করে। পরিবর্তে, RL এর লক্ষ্য হল পছন্দসই ফলাফলগুলিকে শক্তিশালী করে এবং দরিদ্রদের শাস্তি দিয়ে একটি প্রক্রিয়াকে অপ্টিমাইজ করা।

তাদের গবেষণায়, মিলসন এবং সহকর্মীরা অভিনেতা-সমালোচক নিউরাল নেটওয়ার্ক নামক একটি RL এজেন্টকে রুবিডিয়াম পরমাণুর BEC তৈরির জন্য তাদের যন্ত্রে 30 টি পরামিতি সামঞ্জস্য করার অনুমতি দেয়। তারা পূর্ববর্তী BEC-সৃষ্টি চক্রের সময় অনুভূত 30টি পরিবেশগত পরামিতি সহ এজেন্টকে সরবরাহ করেছিল। "কেউ একজন অভিনেতাকে সিদ্ধান্ত গ্রহণকারী হিসাবে ভাবতে পারে, বিভিন্ন পরিবেশগত উদ্দীপনার প্রতিক্রিয়া হিসাবে কীভাবে কাজ করা যায় তা নির্ধারণ করার চেষ্টা করে," মিলসন ব্যাখ্যা করেন। “সমালোচক অভিনেতার কাজগুলি কতটা ভাল করতে চলেছে তা বোঝার চেষ্টা করছেন। এটির কাজটি মূলত গৃহীত সম্ভাব্য পদক্ষেপগুলির 'ভালো' বা 'মন্দতা' মূল্যায়ন করে অভিনেতাকে প্রতিক্রিয়া প্রদান করা।

পূর্ববর্তী পরীক্ষামূলক রানের তথ্যের উপর তাদের RL এজেন্টকে প্রশিক্ষণ দেওয়ার পরে, আলবার্টা পদার্থবিদরা দেখতে পান যে RL-নির্দেশিত নিয়ন্ত্রক ক্রমাগতভাবে একটি চৌম্বকীয় ফাঁদে রুবিডিয়াম পরমাণু লোড করার ক্ষেত্রে মানুষের চেয়ে বেশি পারফর্ম করেছে। মিলসন বলেছেন, প্রধান ত্রুটি ছিল প্রশিক্ষণের তথ্য সংগ্রহের জন্য প্রয়োজনীয় সময়। "যদি আমরা ফ্লুরোসেন্স-ভিত্তিক ইমেজিংয়ের মতো একটি অ-ধ্বংসাত্মক ইমেজিং কৌশল প্রবর্তন করতে পারি, তবে আমরা মূলত সিস্টেমটি সব সময় ডেটা সংগ্রহ করতে পারতাম, বর্তমানে কে বা কোন উদ্দেশ্যে সিস্টেমটি ব্যবহার করছে তা বিবেচনা না করে," তিনি বলেন ফিজিক্স ওয়ার্ল্ড.

ধাপে ধাপে

একটি পৃথক কাজের নেতৃত্বে পদার্থবিদ ড ভ্যালেন্টিন ভলচকভ of the Max Planck Institute for Intelligent Systems and the University of Tübingen, Germany, together with his Tübingen colleague আন্দ্রেয়াস গুন্থার, took a different approach. Instead of training their RL agent to optimize dozens of experimental parameters, they focused on just two: the magnetic field gradient of the MOT,  and the frequency of the laser light used to cool and trap rubidium atoms in it.

The optimum value of the laser frequency is generally one that produces the greatest number of atoms N সর্বনিম্ন তাপমাত্রায় T। যাইহোক, এই সর্বোত্তম মান পরিবর্তন as the temperature drops due to interactions between the atoms and the laser light. The Tübingen team therefore allowed their RL agent to adjust parameters at 25 sequential time steps during a 1.5-second-long MOT loading cycle, and “rewarded” it for getting as close as possible to the desired value of N/T at the end, as measured by fluorescence imaging.

যদিও আরএল এজেন্ট এমওটি-তে পরমাণুকে শীতল করার জন্য পূর্বে-অজানা কোনো কৌশল নিয়ে আসেনি - "একটি বেশ বিরক্তিকর ফলাফল", ভলচকভ রসিকতা করে - এটি পরীক্ষামূলক যন্ত্রপাতিটিকে আরও শক্তিশালী করে তুলেছিল। "যদি আমাদের নমুনা নেওয়ার সময় স্কেলে কিছু বিশৃঙ্খলা দেখা দেয়, তাহলে এজেন্টকে সেই অনুযায়ী প্রশিক্ষিত করা হলে তা প্রতিক্রিয়া জানাতে সক্ষম হবে," তিনি বলেছেন। এই ধরনের স্বয়ংক্রিয় সমন্বয়, তিনি যোগ করেন, পোর্টেবল কোয়ান্টাম ডিভাইস তৈরির জন্য অত্যাবশ্যক হবে যেগুলি "পিএইচডি ছাত্রদের 24-7 বছর ধরে রাখতে পারে না"।

জটিল সিস্টেমের জন্য একটি টুল

ভলচকভ মনে করেন কোল্ড-এটম পদার্থবিজ্ঞানে আরএল-এর আরও ব্যাপক প্রয়োগ থাকতে পারে। "আমি দৃঢ়ভাবে বিশ্বাস করি যে শক্তিবৃদ্ধি শিক্ষায় পর্যাপ্ত মাত্রার স্বাধীনতার সাথে আল্ট্রাকোল্ড কোয়ান্টাম গ্যাস পরীক্ষাগুলির নিয়ন্ত্রণে প্রয়োগ করা হলে অপারেশনের নতুন মোড এবং কাউন্টার-ইনটুইটিভ কন্ট্রোল সিকোয়েন্স তৈরি করার সম্ভাবনা রয়েছে," তিনি বলেন ফিজিক্স ওয়ার্ল্ড. "এটি আরও জটিল পারমাণবিক প্রজাতি এবং অণুর জন্য বিশেষভাবে প্রাসঙ্গিক। অবশেষে, নিয়ন্ত্রণের এই নতুন মোডগুলি বিশ্লেষণ করা আরও বহিরাগত আল্ট্রাকোল্ড গ্যাসগুলিকে পরিচালনা করে এমন শারীরিক নীতিগুলির উপর আলোকপাত করতে পারে।"

মিলসন কৌশলটির সম্ভাব্যতা সম্পর্কে একইভাবে উত্সাহী। "ব্যবহার-ক্ষেত্রগুলি সম্ভবত অন্তহীন, পারমাণবিক পদার্থবিদ্যার সমস্ত ক্ষেত্রে বিস্তৃত," তিনি বলেছেন। "অপ্টিক্যাল ট্যুইজারে পরমাণু লোড করার অপ্টিমাইজেশন থেকে, সর্বোত্তম স্টোরেজ এবং কোয়ান্টাম তথ্য পুনরুদ্ধারের জন্য কোয়ান্টাম মেমরিতে প্রোটোকল ডিজাইন করা পর্যন্ত, মেশিন লার্নিং পারমাণবিক এবং কোয়ান্টাম পদার্থবিজ্ঞানে পাওয়া এই জটিল, বহু-বডি পরিস্থিতিগুলির জন্য খুব উপযুক্ত বলে মনে হচ্ছে।"

আলবার্টা দলের কাজ প্রকাশিত হয় মেশিন লার্নিং: বিজ্ঞান ও প্রযুক্তি. Tübingen টিমের কাজ একটিতে প্রদর্শিত হয় নথিপত্র উদ্ভাবনের.

  • This article was amended on 31 January 2024 to clarify Valentin Volchkov’s affiliations and details of the Tübingen experiment.

সময় স্ট্যাম্প:

থেকে আরো ফিজিক্স ওয়ার্ল্ড

জটিল সিস্টেমের পরিবর্তনগুলি মোকাবেলা করার জন্য নতুন পদ্ধতি গভীর নিউরাল নেটওয়ার্কগুলিকে পুনরায় প্রশিক্ষণ দেয়

উত্স নোড: 1975243
সময় স্ট্যাম্প: ফেব্রুয়ারী 23, 2023