การเรียนรู้ของเครื่องช่วยลดความยุ่งยากในการทดลองอะตอมเย็น – Physics World

การเรียนรู้ของเครื่องช่วยลดความยุ่งยากในการทดลองอะตอมเย็น – Physics World

โหนดต้นทาง: 3091277


ภาพถ่ายห้องสุญญากาศที่บรรจุรูบิเดียม MOT ล้อมรอบด้วยระบบทัศนศาสตร์และระบบสร้างภาพ
การปรับอัตโนมัติ: มุมมองในห้องสุญญากาศที่มีตัวดักจับด้วยแสงแม่เหล็กรูบิเดียม (MOT) ของกลุ่ม Tübingen ความถี่ของเลเซอร์ MOT ถูกควบคุมโดยตัวแทนการเรียนรู้การเสริมแรง (เอื้อเฟื้อโดย: Malte Reinschmidt)

อะตอมเย็นช่วยแก้ปัญหามากมายในเทคโนโลยีควอนตัม ต้องการคอมพิวเตอร์ควอนตัมหรือไม่? คุณสามารถสร้างได้จาก อาร์เรย์ของอะตอมที่เย็นจัด. ต้องการเครื่องกระจายควอนตัมสำหรับเครือข่ายการสื่อสารที่ปลอดภัยหรือไม่? อะตอมเย็น คุณได้รับการคุ้มครอง. แล้วเครื่องจำลองควอนตัมสำหรับปัญหาเรื่องควบแน่นที่ซับซ้อนล่ะ ใช่, อะตอมเย็น ก็สามารถทำเช่นนั้นได้เช่นกัน

ข้อเสียคือต้องทำสิ่งเหล่านี้ มูลค่ารางวัลโนเบลประมาณสองรางวัล ของอุปกรณ์ทดลอง ที่แย่กว่านั้นคือแหล่งที่มาของอารมณ์เสียน้อยที่สุด - การเปลี่ยนแปลงของอุณหภูมิในห้องปฏิบัติการ, สนามแม่เหล็กที่หลงทาง (อะตอมเย็นก็ทำให้ แมกนีโตมิเตอร์ควอนตัมที่ยอดเยี่ยม) แม้แต่ประตูที่กระแทก ก็สามารถรบกวนอาร์เรย์ที่ซับซ้อนของเลเซอร์ เลนส์ ขดลวดแม่เหล็ก และอุปกรณ์อิเล็กทรอนิกส์ที่ทำให้ฟิสิกส์ของอะตอมเย็นเป็นไปได้

เพื่อรับมือกับความซับซ้อนนี้ นักฟิสิกส์อะตอมเย็นได้เริ่มสำรวจวิธีการใช้การเรียนรู้ของเครื่องเพื่อเพิ่มการทดลองของพวกเขา ตัวอย่างเช่น ในปี 2018 ทีมงานของ Australian National University ได้พัฒนา a กิจวัตรที่ปรับให้เหมาะสมโดยเครื่องจักรสำหรับการโหลดอะตอมลงในกับดักแมกนีโตออปติคอล (MOTs) ที่เป็นจุดเริ่มต้นสำหรับการทดลองอะตอมเย็น ในปี 2019 กลุ่มที่ RIKEN ในญี่ปุ่นได้ใช้หลักการนี้กับขั้นตอนหลังของกระบวนการทำความเย็น โดยใช้การเรียนรู้ของเครื่องเพื่อ ระบุวิธีการทำความเย็นอะตอมแบบใหม่และมีประสิทธิภาพ ที่อุณหภูมิเศษขององศาเหนือศูนย์สัมบูรณ์ โดยที่พวกมันจะเข้าสู่สถานะควอนตัมที่เรียกว่าคอนเดนเสทโบส-ไอน์สไตน์ (BEC)

ปล่อยให้เครื่องทำมัน

ในการพัฒนาล่าสุดในแนวโน้มนี้ ทีมนักฟิสิกส์อิสระสองทีมได้แสดงให้เห็นว่ารูปแบบการเรียนรู้ของเครื่องที่เรียกว่าการเรียนรู้แบบเสริมสามารถช่วยให้ระบบอะตอมเย็นจัดการกับการหยุดชะงักได้

“ในห้องปฏิบัติการของเรา เราพบว่าระบบการผลิต BEC ของเราค่อนข้างไม่เสถียร ดังนั้น เราจึงสามารถผลิต BEC ที่มีคุณภาพสมเหตุสมผลได้เพียงไม่กี่ชั่วโมงในแต่ละวันเท่านั้น” อธิบาย นิค มิลสันซึ่งเป็นนักศึกษาปริญญาเอกจากมหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา ซึ่งเป็นผู้นำ หนึ่งในโครงการ. การเพิ่มประสิทธิภาพระบบนี้ด้วยมือได้รับการพิสูจน์แล้วว่ามีความท้าทาย: "คุณมีขั้นตอนที่ได้รับการสนับสนุนจากฟิสิกส์ที่ซับซ้อนและยากลำบากโดยทั่วไป และสิ่งนี้ประกอบขึ้นด้วยอุปกรณ์ทดลองซึ่งโดยธรรมชาติแล้วจะมีความไม่สมบูรณ์อยู่บ้าง" มิลสันกล่าว “นี่คือเหตุผลว่าทำไมหลายกลุ่มจึงจัดการกับปัญหาเกี่ยวกับการเรียนรู้ของเครื่อง และทำไมเราจึงหันมาใช้การเรียนรู้แบบเสริมเพื่อจัดการกับปัญหาในการสร้างตัวควบคุมที่สอดคล้องและมีปฏิกิริยาโต้ตอบ”

การเรียนรู้แบบเสริมกำลัง (RL) ทำงานแตกต่างจากกลยุทธ์การเรียนรู้ของเครื่องอื่นๆ ที่รับข้อมูลอินพุตที่มีป้ายกำกับหรือไม่มีป้ายกำกับ แล้วใช้เพื่อคาดการณ์ผลลัพธ์ ในทางกลับกัน RL มุ่งหวังที่จะปรับกระบวนการให้เหมาะสมโดยเสริมผลลัพธ์ที่พึงประสงค์และลงโทษผลลัพธ์ที่น่าสงสาร

ในการศึกษาของพวกเขา มิลสันและเพื่อนร่วมงานอนุญาตให้ตัวแทน RL ที่เรียกว่าโครงข่ายประสาทเทียมสำหรับนักแสดงและนักวิจารณ์ ปรับพารามิเตอร์ 30 ตัวในเครื่องมือของพวกเขาเพื่อสร้าง BEC ของอะตอมรูบิเดียม พวกเขายังจัดหาพารามิเตอร์สภาพแวดล้อม 30 รายการให้กับตัวแทนที่ตรวจจับได้ในระหว่างรอบการสร้าง BEC ก่อนหน้านี้ “เราอาจคิดว่านักแสดงเป็นผู้มีอำนาจตัดสินใจ โดยพยายามหาวิธีปฏิบัติเพื่อตอบสนองต่อสิ่งเร้าด้านสิ่งแวดล้อมต่างๆ” มิลสันอธิบาย “นักวิจารณ์พยายามคิดว่าการแสดงของนักแสดงจะออกมาดีแค่ไหน หน้าที่หลักคือการให้ข้อเสนอแนะแก่นักแสดงโดยการประเมิน 'ความดี' หรือ 'ความเลว' ของการกระทำที่อาจเกิดขึ้น”

หลังจากฝึกอบรมเจ้าหน้าที่ RL เกี่ยวกับข้อมูลจากการทดลองครั้งก่อน นักฟิสิกส์ของอัลเบอร์ตาพบว่าตัวควบคุมที่ได้รับคำแนะนำจาก RL มีประสิทธิภาพเหนือกว่ามนุษย์อย่างต่อเนื่องในการโหลดอะตอมของรูบิเดียมลงในกับดักแม่เหล็ก ข้อเสียเปรียบหลัก Milson กล่าวว่าคือเวลาที่ต้องใช้ในการรวบรวมข้อมูลการฝึกอบรม “หากเราสามารถแนะนำเทคนิคการถ่ายภาพแบบไม่ทำลาย เช่น การถ่ายภาพด้วยแสงฟลูออเรสเซนซ์ เราก็สามารถให้ระบบรวบรวมข้อมูลได้ตลอดเวลา ไม่ว่าใครจะใช้ระบบอยู่ในปัจจุบัน หรือเพื่อวัตถุประสงค์อะไร” เขากล่าว โลกฟิสิกส์.

ทีละขั้นตอน

ในงานแยกนักฟิสิกส์นำโดย วาเลนติน โวลชคอฟ ของสถาบัน Max Planck สำหรับระบบอัจฉริยะและมหาวิทยาลัย Tübingen ประเทศเยอรมนี ร่วมกับเพื่อนร่วมงาน Tübingen ของเขา อันเดรียส กุนเธอร์, ใช้แนวทางที่แตกต่างออกไป แทนที่จะฝึกตัวแทน RL เพื่อเพิ่มประสิทธิภาพพารามิเตอร์การทดลองหลายสิบรายการ พวกเขามุ่งเน้นไปที่สองสิ่งเท่านั้น ได้แก่ การไล่ระดับของสนามแม่เหล็กของ MOT และความถี่ของแสงเลเซอร์ที่ใช้ในการทำให้เย็นลงและดักจับอะตอมของรูบิเดียมในนั้น

โดยทั่วไปค่าที่เหมาะสมที่สุดของความถี่เลเซอร์คือค่าที่สร้างอะตอมจำนวนมากที่สุด N ที่อุณหภูมิต่ำสุด T. อย่างไรก็ตามสิ่งนี้ การเปลี่ยนแปลงค่าที่เหมาะสมที่สุด เมื่ออุณหภูมิลดลงเนื่องจากปฏิกิริยาระหว่างอะตอมกับแสงเลเซอร์ ดังนั้นทีมงาน Tübingen จึงอนุญาตให้ตัวแทน RL ปรับพารามิเตอร์ที่ 25 ขั้นตอนตามลำดับในระหว่างรอบการโหลด MOT ที่มีความยาว 1.5 วินาที และ "ให้รางวัล" สำหรับค่าที่ใกล้เคียงกับค่าที่ต้องการมากที่สุด ไม่ระบุ ในตอนท้ายซึ่งวัดโดยการถ่ายภาพเรืองแสง

ในขณะที่ตัวแทน RL ไม่ได้คิดกลยุทธ์ใด ๆ ที่ไม่เคยรู้จักมาก่อนในการทำความเย็นอะตอมใน MOT - "ผลลัพธ์ที่ค่อนข้างน่าเบื่อ" Volchkov พูดติดตลก - มันทำให้อุปกรณ์ทดลองมีความแข็งแกร่งมากขึ้น “หากเกิดการรบกวนในช่วงเวลาของการสุ่มตัวอย่างของเรา เจ้าหน้าที่ควรจะสามารถตอบสนองได้หากได้รับการฝึกอบรมตามนั้น” เขากล่าว เขากล่าวเสริมว่าการปรับเปลี่ยนอัตโนมัติดังกล่าวจะมีความสำคัญต่อการสร้างอุปกรณ์ควอนตัมแบบพกพาที่ “ไม่สามารถให้นักศึกษาระดับปริญญาเอกดูแลพวกเขาได้ตลอด 24-7 วัน”

เครื่องมือสำหรับระบบที่ซับซ้อน

Volchkov คิดว่า RL ยังสามารถนำไปใช้ในวงกว้างในฟิสิกส์อะตอมเย็นได้ “ผมเชื่อมั่นว่าการเรียนรู้แบบเสริมกำลังมีศักยภาพที่จะให้รูปแบบการทำงานใหม่ๆ และลำดับการควบคุมที่ขัดกับสัญชาตญาณ เมื่อนำไปใช้กับการควบคุมการทดลองก๊าซควอนตัมที่เย็นจัดด้วยระดับอิสระที่เพียงพอ” เขากล่าว โลกฟิสิกส์. “สิ่งนี้มีความเกี่ยวข้องโดยเฉพาะกับสายพันธุ์และโมเลกุลของอะตอมที่ซับซ้อนมากขึ้น ในที่สุดการวิเคราะห์รูปแบบการควบคุมใหม่เหล่านี้อาจทำให้เข้าใจหลักการทางกายภาพที่ควบคุมก๊าซเย็นจัดที่แปลกใหม่มากขึ้น”

มิลสันก็กระตือรือร้นเช่นเดียวกันกับศักยภาพของเทคนิคนี้ “กรณีการใช้งานน่าจะไม่มีที่สิ้นสุด ครอบคลุมทุกด้านของฟิสิกส์อะตอม” เขากล่าว “จากการเพิ่มประสิทธิภาพการโหลดอะตอมลงในแหนบแบบออปติคอล ไปจนถึงการออกแบบโปรโตคอลในหน่วยความจำควอนตัมเพื่อการจัดเก็บข้อมูลที่เหมาะสมที่สุดและการดึงข้อมูลควอนตัม การเรียนรู้ของเครื่องดูเหมือนจะเหมาะสมอย่างยิ่งกับสถานการณ์ที่ซับซ้อนและมีหลายส่วนที่พบในฟิสิกส์อะตอมและควอนตัม”

ผลงานของทีมอัลเบอร์ตาได้รับการตีพิมพ์ใน การเรียนรู้ของเครื่อง: วิทยาศาสตร์และเทคโนโลยี. ผลงานของทีม Tübingen ปรากฏใน arXiv พิมพ์ล่วงหน้า.

  • บทความนี้ได้รับการแก้ไขเมื่อวันที่ 31 มกราคม 2024 เพื่อชี้แจงความเกี่ยวข้องของ Valentin Volchkov และรายละเอียดของการทดลอง Tübingen

ประทับเวลา:

เพิ่มเติมจาก โลกฟิสิกส์