למידת מכונה מוציאה טרחה מניסויים באטומים קרים - עולם הפיזיקה

למידת מכונה מוציאה טרחה מניסויים באטומים קרים - עולם הפיזיקה

צומת המקור: 3091277


תמונה של תא הוואקום המכיל את רובידיום MOT, מוקף באופטיקה ומערכות הדמיה
התאמות אוטומטיות: מבט לתוך תא הוואקום המכיל את מלכודת המגנטו-אופטית רובידיום (MOT) של קבוצת טובינגן. תדירות הלייזרים של MOT נשלטת על ידי סוכן למידת חיזוק. (באדיבות: מאלטה ריינשמידט)

אטומים קרים פותרים בעיות רבות בטכנולוגיה הקוונטית. רוצים מחשב קוונטי? אתה יכול לעשות אחד מא מערך של אטומים קרים במיוחד. זקוקים למחזר קוונטי לרשת תקשורת מאובטחת? אטומים קרים האם אתה מכוסה. מה דעתך על סימולטור קוונטי לבעיות מורכבות של חומר דחוס? כֵּן, אטומים קרים יכול לעשות את זה גם.

החיסרון הוא שלעשות כל אחד מהדברים האלה צריך בערך שני פרסי נובל של מנגנון ניסוי. גרוע מכך, המקורות הזעירים ביותר לעצבנות - שינוי בטמפרטורת המעבדה, שדה מגנטי תועה (אטומים קרים גם יוצרים מגנומטרים קוונטיים מצוינים), אפילו דלת נטרקת - יכולה לערער את המערכים המסובכים של לייזרים, אופטיקה, סלילים מגנטיים ואלקטרוניקה שמאפשרים פיזיקת אטומים קרים.

כדי להתמודד עם המורכבות הזו, פיזיקאים בעלי אטום קר החלו לחקור דרכים להשתמש בלמידת מכונה כדי להגביר את הניסויים שלהם. בשנת 2018, למשל, צוות באוניברסיטה הלאומית של אוסטרליה פיתח א שגרה מותאמת למכונה להעמסת אטומים למלכודות המגנטו-אופטיות (MOTs) המהווים את נקודת המוצא לניסויים באטומים קרים. בשנת 2019, קבוצה ב-RIKEN ביפן יישמה את העיקרון הזה בשלב מאוחר יותר של תהליך הקירור, תוך שימוש בלמידת מכונה כדי לזהות דרכים חדשות ויעילות לקירור אטומים לטמפרטורות של שבריר מעלה מעל האפס המוחלט, שם הם נכנסים למצב קוונטי המכונה קונדנסט Bose-Einstein (BEC).

תן למכונה לעשות את זה

בפיתוח האחרון במגמה זו, שני צוותים עצמאיים של פיזיקאים הראו שצורה של למידת מכונה המכונה למידת חיזוק יכולה לעזור למערכות אטום קר להתמודד עם שיבושים.

"במעבדה שלנו גילינו שהמערכת לייצור BEC שלנו הייתה די לא יציבה, כך שהייתה לנו את היכולת לייצר BECs באיכות סבירה רק לכמה שעות במהלך היום", מסביר ניק מילסון, דוקטורנט באוניברסיטת אלברטה, קנדה שהוביל אחד הפרויקטים. אופטימיזציה של מערכת זו ביד הוכיחה את עצמה כמאתגרת: "יש לך הליך שבבסיסו פיסיקה מסובכת ובלתי ניתנת לפתרון, וזה מתווסף על ידי מנגנון ניסיוני שבאופן טבעי יהיה לו מידה מסוימת של חוסר שלמות", אומר מילסון. "זו הסיבה שקבוצות רבות התמודדו עם הבעיה עם למידת מכונה, ומדוע אנו פונים ללמידה חיזוקית כדי להתמודד עם הבעיה של בניית בקר עקבי ותגובתי."

למידת חיזוק (RL) פועלת בצורה שונה מאסטרטגיות אחרות של למידת מכונה שמקבלות נתוני קלט מסומנים או לא מסומנים ומשתמשות בהם כדי לחזות תפוקות. במקום זאת, RL שואפת לייעל תהליך על ידי חיזוק תוצאות רצויות והענשת תוצאות גרועות.

במחקר שלהם, מילסון ועמיתיו אפשרו לסוכן RL שנקרא רשת עצבית מבקרת שחקן להתאים 30 פרמטרים במנגנון שלהם ליצירת BECs של אטומי רובידיום. הם גם סיפקו לסוכן 30 פרמטרים סביבתיים שנחושו במהלך מחזור יצירת BEC הקודם. "אפשר לחשוב על השחקן כמקבל ההחלטות, המנסה להבין איך לפעול בתגובה לגירויים סביבתיים שונים", מסביר מילסון. "המבקר מנסה להבין כמה טוב הפעולות של השחקן עומדות לבצע. תפקידו הוא בעצם לספק משוב לשחקן על ידי הערכת ה'טוב' או ה'רע' של פעולות פוטנציאליות שננקטו".

לאחר שהכשירו את סוכן ה-RL שלהם על נתונים מריצות ניסוי קודמות, הפיזיקאים של אלברטה גילו שהבקר המונחה RL עלה באופן עקבי על בני אדם בהעמסת אטומי רובידיום לתוך מלכודת מגנטית. החיסרון העיקרי, אומר מילסון, היה הזמן שנדרש לאיסוף נתוני אימונים. "אם היינו יכולים להכניס טכניקת הדמיה לא הרסנית כמו הדמיה מבוססת פלואורסצנציה, היינו יכולים בעצם שהמערכת אוספת נתונים כל הזמן, לא משנה מי משתמש כרגע במערכת, או לאיזו מטרה", הוא אומר. עולם הפיזיקה.

צעד אחר צעד

בעבודה נפרדת, פיזיקאים בראשות ולנטין וולצ'קוב של מכון מקס פלנק למערכות חכמות ואוניברסיטת טובינגן, גרמניה, יחד עם עמיתו מטובינגן אנדראס גינתר, נקטה בגישה אחרת. במקום לאמן את סוכן ה-RL שלהם לייעל עשרות פרמטרים ניסויים, הם התמקדו בשניים בלבד: שיפוע השדה המגנטי של ה-MOT, ותדירות אור הלייזר המשמש לקירור וללכוד בו אטומי רובידיום.

הערך האופטימלי של תדר הלייזר הוא בדרך כלל כזה שמייצר את המספר הגדול ביותר של אטומים N בטמפרטורה הנמוכה ביותר T. עם זאת, זה שינויי ערך מיטביים כאשר הטמפרטורה יורדת עקב אינטראקציות בין האטומים לאור הלייזר. לכן, צוות טובינגן אפשר לסוכן ה-RL שלהם להתאים פרמטרים ב-25 שלבי זמן עוקבים במהלך מחזור טעינת MOT של 1.5 שניות, ו"תגמל" אותו על כך שהוא התקרב ככל האפשר לערך הרצוי של N/T בסוף, כפי שנמדד על ידי הדמיית פלואורסצנציה.

בעוד שסוכן ה-RL לא המציא אסטרטגיות שלא היו ידועות קודם לכן לקירור אטומים ב-MOT - "תוצאה משעממת למדי", מתבדח וולצ'קוב - זה כן הפך את מנגנון הניסוי לחזק יותר. "אם יש הפרעה מסוימת בסולם הזמן של הדגימה שלנו, אז הסוכן אמור להיות מסוגל להגיב לזה אם הוא מאומן בהתאם", הוא אומר. התאמות אוטומטיות כאלה, הוא מוסיף, יהיו חיוניות ליצירת מכשירים קוונטיים ניידים ש"לא יכולים לתת לדוקטורנטים לטפל בהם 24-7".

כלי למערכות מורכבות

וולצ'קוב חושב של-RL יכול להיות גם יישומים רחבים יותר בפיזיקה של אטומים קרים. "אני מאמין בתוקף שללימוד חיזוק יש פוטנציאל להניב אופני פעולה חדשים ורצפי בקרה נגד אינטואיציה כאשר הם מיושמים בבקרה של ניסויי גז קוונטי קרים עם דרגות מספיקות של חופש", הוא אומר. עולם הפיזיקה. "זה רלוונטי במיוחד עבור מינים ומולקולות אטומיות מורכבות יותר. בסופו של דבר, ניתוח אופני השליטה החדשים הללו עשוי לשפוך אור על עקרונות פיזיקליים השולטים בגזים אולטרה-קרים אקזוטיים יותר."

מילסון מתלהב באופן דומה מהפוטנציאל של הטכניקה. "מקרי השימוש הם כנראה אינסופיים, המשתרעים על כל תחומי הפיזיקה האטומית", הוא אומר. "מאופטימיזציה של טעינת אטומים לתוך פינצטה אופטית, ועד לתכנון פרוטוקולים בזיכרון קוונטי לאחסון ואחזור אופטימליים של מידע קוונטי, למידת מכונה נראית מתאימה מאוד לתרחישים המסובכים האלה, מרובי גוף שנמצאים בפיזיקה האטומית והקוואנטית."

עבודתו של צוות אלברטה מתפרסמת ב למידת מכונה: מדע וטכנולוגיה. עבודתו של צוות טובינגן מופיעה ב- arXiv הדפסה מראש.

  • מאמר זה תוקן ב-31 בינואר 2024 כדי להבהיר את ההשתייכות והפרטים של ולנטין וולצ'קוב על הניסוי בטובינגן.

בול זמן:

עוד מ עולם הפיזיקה