Thought Propagation: An Analogical Approach To Complex Reasoning With Large Language Models - KDnuggets

הועלה מחדש על ידי אפלטון

עוקב: 0

הפצת מחשבה: גישה אנלוגית להיגיון מורכב עם מודלים של שפה גדולים

המנות העיקריות

הפצת מחשבות (TP) היא שיטה חדשה המשפרת את יכולות החשיבה המורכבות של מודלים של שפה גדולה (LLM).
TP ממנפת בעיות מקבילות ופתרונותיהן כדי לשפר את ההיגיון, במקום לגרום ל-LLMs להגיב מאפס.
ניסויים במשימות שונות מראים ש-TP עולה בהרבה על שיטות הבסיס, עם שיפורים שנעים בין 12% ל-15%.

TP מנחה תחילה את ה-LLMs להציע ולפתור קבוצה של בעיות מקבילות הקשורות לאחת הקלט. לאחר מכן, TP עושה שימוש חוזר בתוצאות של בעיות מקבילות כדי להניב ישירות פתרון חדש או להפיק תוכנית עתירת ידע לביצוע כדי לתקן את הפתרון הראשוני שהושג מאפס.

אין להכחיש את הרבגוניות וכוח החישוב של מודלים של שפה גדולה (LLMs), אך הם אינם חסרי גבול. אחד האתגרים המשמעותיים והעקביים ביותר ל-LLMs הוא הגישה הכללית שלהם לפתרון בעיות, המורכבת מהיגיון מהעקרונות הראשונים עבור כל משימה חדשה שנתקלת בה. זה בעייתי, מכיוון שהוא מאפשר מידת הסתגלות גבוהה, אך גם מגביר את הסבירות לטעויות, במיוחד במשימות הדורשות חשיבה רב-שלבית.

האתגר של "היגיון מאפס" בולט במיוחד במשימות מורכבות הדורשות שלבים מרובים של היגיון והסקת מסקנות. לדוגמה, אם LLM מתבקש למצוא את הנתיב הקצר ביותר ברשת של נקודות מחוברות, הוא בדרך כלל לא ימנף ידע קודם או בעיות מקבילות כדי למצוא פתרון. במקום זאת, הוא ינסה לפתור את הבעיה במנותק, מה שיכול להוביל לתוצאות לא אופטימליות או אפילו לטעויות מוחלטות. להיכנס הפצת מחשבות (TP), שיטה שנועדה להגביר את יכולות החשיבה של LLMs. TP שואפת להתגבר על המגבלות הטמונות של LLMs על ידי לאפשר להם לשאוב ממאגר של בעיות מקבילות והפתרונות התואמים להן. גישה חדשנית זו לא רק משפרת את הדיוק של פתרונות שנוצרו על ידי LLM, אלא גם משפרת משמעותית את יכולתם להתמודד עם משימות חשיבה מורכבות מרובות שלבים. על ידי מינוף כוחה של האנלוגיה, TP מספק מסגרת המגבירה את יכולות החשיבה המולדות של LLMs, ומביאה אותנו צעד אחד קרוב יותר למימושן של מערכות מלאכותיות אינטליגנטיות באמת.

הפצת מחשבה כוללת שני שלבים עיקריים:

ראשית, ה-LLM מתבקש להציע ולפתור קבוצה של בעיות מקבילות הקשורות לבעיית הקלט
לאחר מכן, הפתרונות לבעיות האנלוגיות הללו משמשים כדי להניב ישירות פתרון חדש או כדי לתקן את הפתרון הראשוני

תהליך זיהוי בעיות מקבילות מאפשר ל-LLM לעשות שימוש חוזר באסטרטגיות ופתרונות לפתרון בעיות, ובכך לשפר את יכולות החשיבה שלו. TP תואם לשיטות הנחיה קיימות, ומספק פתרון הניתן להכללה שניתן לשלב במשימות שונות ללא הנדסה משמעותית ספציפית למשימה.

תהליך הפצת מחשבות
איור 1: תהליך הפצת המחשבה (תמונה מנייר)

יתר על כן, אין לזלזל ביכולת ההסתגלות של TP. התאימות שלו לשיטות הנחיה קיימות הופכת אותו לכלי רב תכליתי. משמעות הדבר היא ש-TP אינו מוגבל לאף סוג ספציפי של תחום פתרון בעיות. זה פותח אפיקים מלהיבים לכוונון ואופטימיזציה ספציפיים למשימה, ובכך מעלה את התועלת והיעילות של LLMs בספקטרום רחב של יישומים.

ניתן לשלב את היישום של הפצת מחשבות בזרימת העבודה של LLMs קיימים. לדוגמה, במשימת Reasoning במסלול הקצר ביותר, TP יכול לפתור תחילה קבוצה של בעיות פשוטות יותר, אנלוגיות, כדי להבין נתיבים אפשריים שונים. לאחר מכן הוא ישתמש בתובנות הללו כדי לפתור את הבעיה המורכבת, ובכך יגדיל את הסבירות למצוא את הפתרון האופטימלי.

דוגמה 1

המשימות: נימוק הקצר ביותר
בעיות אנלוגיות: הנתיב הקצר ביותר בין נקודה A ל-B, המסלול הקצר ביותר בין נקודה B ל-C
פתרון סופי: נתיב אופטימלי מנקודה A ל-C בהתחשב בפתרונות של בעיות אנלוגיות

דוגמה 2

המשימות: כתיבה יצירתית
בעיות אנלוגיות: כתבו סיפור קצר על חברות, כתבו סיפור קצר על אמון
פתרון סופי: כתבו סיפור קצר מורכב המשלב נושאים של חברות ואמון

התהליך כרוך בפתרון בעיות אנלוגיות אלו תחילה, ולאחר מכן שימוש בתובנות שהושגו כדי להתמודד עם המשימה המורכבת שעל הפרק. שיטה זו הוכיחה את יעילותה לאורך משימות מרובות, והציגה שיפורים מהותיים במדדי ביצועים.

ההשלכות של הפצת מחשבות חורגות משיפור המדדים הקיימים בלבד. לטכניקת הנחיה זו יש פוטנציאל לשנות את האופן שבו אנו מבינים ופריסה של LLMs. המתודולוגיה מדגישה מעבר מפתרון בעיות אטומי מבודד לגישה הוליסטית יותר, קשורה זו בזו. זה מנחה אותנו לשקול כיצד מנהלי לימודים בלימודי למידה יכולים ללמוד לא רק מנתונים, אלא מתהליך פתרון הבעיות עצמו. על ידי עדכון מתמיד של הבנתם באמצעות פתרונות לבעיות מקבילות, LLMs המצוידים ב-TP מוכנים יותר להתמודד עם אתגרים בלתי צפויים, מה שהופך אותם לגמישים ובעלי יכולת הסתגלות בסביבות המתפתחות במהירות.

הפצת מחשבות היא תוספת מבטיחה לארגז הכלים של שיטות הנחיה שמטרתן לשפר את היכולות של LLMs. על ידי מתן אפשרות ל-LLMs למנף בעיות מקבילות ואת הפתרונות שלהן, TP מספק שיטת חשיבה ניואנסית ויעילה יותר. ניסויים מאשרים את יעילותו, מה שהופך אותו לאסטרטגיה מועמדת לשיפור הביצועים של LLMs במגוון משימות. TP עשוי בסופו של דבר לייצג צעד משמעותי קדימה בחיפוש אחר מערכות בינה מלאכותית מסוגלות יותר.

מתיו מאיו (@mattmayo13) בעל תואר שני במדעי המחשב ותואר שני בכריית נתונים. כעורך ראשי של KDnuggets, מתיו שואף להנגיש מושגים מורכבים במדעי הנתונים. תחומי העניין המקצועיים שלו כוללים עיבוד שפה טבעית, אלגוריתמים של למידת מכונה וחקר בינה מלאכותית מתפתחת. הוא מונע על ידי שליחות לדמוקרטיזציה של ידע בקהילת מדעי הנתונים. מתיו מקודד מאז שהיה בן 6.