מדוע LLMs בשימוש לבד לא יכול לתת מענה לצרכים החזויים של החברה שלך - KDnuggets

הועלה מחדש על ידי אפלטון

עוקב: 0

תוכן ממומן

ChatGPT וכלים דומים המבוססים על מודלים של שפה גדולה (LLMs) הם מדהימים. אבל הם לא כלים לכל מטרה.

זה בדיוק כמו לבחור כלים אחרים לבנייה וליצירה. אתה צריך לבחור את המתאים לתפקיד. לא תנסה להדק בורג עם פטיש או להפוך קציצת המבורגר עם מטרפה. התהליך יהיה מביך, ויגרום לכישלון מבולגן.

מודלים של שפה כמו LLMs מהווים רק חלק מערך הכלים הרחב יותר של למידת מכונה, הכולל גם בינה מלאכותית גנרית וגם AI חזוי. בחירת הסוג הנכון של מודל למידת מכונה חיונית כדי להתאים לדרישות המשימה שלך.

בוא נחפור לעומק מדוע תקני LLM מתאימים יותר לעזור לך לנסח טקסט או לתכנן רעיונות למתנות מאשר להתמודד עם משימות המודל החזוי הקריטיות ביותר של העסק שלך. עדיין יש תפקיד חיוני למודלים ה"מסורתיים" של למידת מכונה שקדמו ללימודי LLM והוכיחו שוב ושוב את ערכם בעסקים. אנו גם נחקור גישה חלוצית לשימוש בכלים אלה ביחד - פיתוח מרגש שאנו ב-Pecan קוראים לו GenAI חזוי.

LLMs מיועדים למילים, לא למספרים

בלמידת מכונה, נעשה שימוש בשיטות מתמטיות שונות כדי לנתח את מה שמכונה "נתוני אימון" - מערך נתונים ראשוני המייצג את הבעיה שמנתח נתונים או מדען נתונים מקווה לפתור.

לא ניתן להפריז במשמעות של נתוני אימון. הוא מחזיק בתוכו את הדפוסים והקשרים שמודל למידת מכונה "ילמד" לחזות תוצאות כאשר הוא יקבל מאוחר יותר נתונים חדשים, בלתי נראים.

אז מה זה בעצם LLM? מודלים של שפה גדולה, או LLMs, נופלים תחת המטריה של למידת מכונה. מקורם בלמידה עמוקה, והמבנה שלהם פותח במיוחד לעיבוד שפה טבעית.

אפשר לומר שהם בנויים על בסיס של מילים. המטרה שלהם היא פשוט לחזות איזו מילה תהיה הבאה ברצף של מילים. לדוגמה, תכונת התיקון האוטומטי של iPhones ב-iOS 17 משתמשת כעת ב-LLM כדי לחזות טוב יותר איזו מילה סביר להניח שתתכוון להקליד הבא.

החוזקות של לימודי LLM ולמידת מכונה מסורתית

עכשיו, דמיינו שאתם מודל למידת מכונה. (תסבול איתנו, אנחנו יודעים שזה מתיחה.) אומנת לחזות מילים. קראת ולמדת מיליוני מילים ממגוון עצום של מקורות בכל מיני נושאים. המנטורים שלך (המכונה גם מפתחים) עזרו לך ללמוד את הדרכים הטובות ביותר לחזות מילים וליצור טקסט חדש שמתאים לבקשת המשתמש.

אבל הנה טוויסט. משתמש נותן לך כעת גיליון אלקטרוני ענק של נתוני לקוחות ועסקאות, עם מיליוני שורות של מספרים, ומבקש ממך לחזות מספרים הקשורים לנתונים הקיימים הללו.

איך לדעתך יתבררו התחזיות שלך? ראשית, בטח תתעצבן שהמשימה הזו לא תואמת את מה שעבדת כל כך קשה כדי ללמוד. (למרבה המזל, ככל הידוע לנו, ל-LLMs עדיין אין רגשות.) חשוב מכך, אתה מתבקש לבצע משימה שאינה תואמת את מה שלמדת לעשות. וכנראה שלא תופיע כל כך טוב.

הפער בין הדרכה למשימה עוזר להסביר מדוע LLMs אינם מתאימים היטב למשימות חזויות הכוללות נתונים מספריים וטבלאיים - פורמט הנתונים העיקרי שרוב העסקים אוספים. במקום זאת, מודל למידת מכונה שנוצר במיוחד ומכוון לטיפול בסוג זה של נתונים יעיל יותר. זה ממש הוכשר לזה.

אתגרי היעילות והאופטימיזציה של LLMs

בנוסף להיותן התאמה טובה יותר לנתונים מספריים, שיטות למידת מכונה מסורתיות הן הרבה יותר יעילות וקלות יותר לאופטימיזציה לביצועים טובים יותר מאשר LLMs.

בוא נחזור לחוויה שלך בהתחזות ל-LLM. לקרוא את כל המילים הללו ולחקור את הסגנון והרצף שלהן נשמע כמו המון עבודה, נכון? יידרש מאמץ רב כדי להפנים את כל המידע הזה.

באופן דומה, ההכשרה המורכבת של LLMs יכולה להביא למודלים עם מיליארדי פרמטרים. המורכבות הזו מאפשרת למודלים הללו להבין ולהגיב לניואנסים הקשים של השפה האנושית. עם זאת, אימון כבד מגיע עם דרישות חישוביות כבדות כאשר LLMs מייצרים תגובות. אלגוריתמי למידת מכונה "מסורתיים" בעלי אוריינטציה מספרית, כמו עצי החלטה או רשתות עצביות, יצטרכו ככל הנראה הרבה פחות משאבי מחשוב. וזה לא מקרה של "גדול יותר טוב יותר". גם אם לימודי LLM יוכלו להתמודד עם נתונים מספריים, ההבדל הזה היה אומר ששיטות למידת מכונה מסורתיות עדיין יהיו מהירות יותר, יעילות יותר, בנות קיימא יותר מבחינה סביבתית וחסכוניות יותר.

בנוסף, האם אי פעם שאלת את ChatGPT כיצד היא ידעה לספק תגובה מסוימת? סביר להניח שהתשובה שלו תהיה מעט מעורפלת:

אני מייצר תגובות המבוססות על תערובת של נתונים מורשים, נתונים שנוצרו על ידי מאמנים אנושיים ונתונים זמינים לציבור. ההכשרה שלי כללה גם מערכי נתונים בקנה מידה גדול שהתקבלו ממגוון מקורות, כולל ספרים, אתרי אינטרנט וטקסטים אחרים, כדי לפתח הבנה רחבה של השפה האנושית. תהליך האימון כולל הפעלת חישובים על אלפי GPUs לאורך שבועות או חודשים, אך פרטים מדויקים ולוחות זמנים הם קנייניים של OpenAI.

How much of the “knowledge” reflected in that response came from the human trainers vs. the public data vs. books? Even ChatGPT itself isn’t sure: “The relative proportions of these sources are unknown, and I don’t have detailed visibility into which specific documents were part of my training set.”

It’s a bit unnerving to have ChatGPT provide such confident answers to your questions but not be able to trace its responses to specific sources. LLMs’ limited interpretability and explainability also pose challenges in optimizing them for particular business needs. It can be hard to understand the rationale behind their information or predictions. To further complicate things, certain businesses contend with regulatory demands that mean they must be able to explain the factors influencing a model’s predictions. All in all, these challenges show that traditional machine learning models — generally more interpretable and explainable — are likely better suited for business use cases.

המקום הנכון עבור לימודי תואר שני בערכת הכלים החזויים של עסקים

אז, האם עלינו פשוט להשאיר את ה-LLM למשימות הקשורות למילים ולשכוח מהם למקרי שימוש חזוי? זה אולי נראה עכשיו שהם לא יכולים לעזור עם חיזוי נטישה של לקוחות או ערך לכל החיים של הלקוח אחרי הכל.

הנה העניין: למרות שאומרים "מודלים מסורתיים של למידה חישובית" גורמים לטכניקות הללו להישמע מובנות וקלות לשימוש, אנו יודעים מהניסיון שלנו ב-Pecan שעסקים עדיין נאבקים במידה רבה לאמץ אפילו את הצורות המוכרות יותר של AI.

42% מהחברות בצפון אמריקה לא התחילו להשתמש בבינה מלאכותית בכלל או רק מתחילות לחקור את האפשרויות שלהן.

Recent research by Workday reveals that 42% of companies in North America either haven’t initiated the use of AI or are just in the early stages of exploring their options. And it’s been over a decade since machine learning tools became more accessible to companies. They’ve had the time, and various tools are available.

מסיבה כלשהי, יישומי AI מוצלחים היו נדירים באופן מפתיע למרות הבאז האדיר סביב מדעי הנתונים וה-AI - והפוטנציאל המוכר שלהם להשפעה עסקית משמעותית. חסר איזשהו מנגנון חשוב שיעזור לגשר על הפער בין ההבטחות של AI לבין היכולת ליישם אותו בצורה פרודוקטיבית.

וזה בדיוק המקום שבו אנו מאמינים ש-LLMs יכולים כעת למלא תפקיד חיוני של גישור. LLMs יכולים לעזור למשתמשים עסקיים לחצות את התהום שבין זיהוי בעיה עסקית לפתרון לבין פיתוח מודל חיזוי.

עם LLMs עכשיו בתמונה, צוותי עסקים ונתונים שאין להם את היכולת או היכולת לקוד ביד מודלים של למידה חישובית יכולים כעת לתרגם טוב יותר את הצרכים שלהם למודלים. הם יכולים "להשתמש במילים שלהם", כפי שהורים אוהבים לומר, כדי להתחיל את תהליך הדוגמנות.

מיזוג לימודי LLM עם טכניקות למידת מכונה שנבנו להצטיין בנתונים עסקיים

היכולת הזו הגיעה כעת ל-Predictive GenAI של Pecan, אשר ממזגת את החוזקות של LLMs עם פלטפורמת למידת המכונה שלנו, המעודנת והאוטומטית. הצ'אט החזוי המופעל על ידי LLM אוסף מידע ממשתמש עסקי כדי להנחות את ההגדרה והפיתוח של שאלה חזויה - הבעיה הספציפית שהמשתמש רוצה לפתור באמצעות מודל.

לאחר מכן, באמצעות GenAI, הפלטפורמה שלנו מייצרת מחברת חיזוי כדי להפוך את הצעד הבא לקראת מודלים לקל עוד יותר. שוב, בהסתמך על יכולות LLM, המחברת מכילה שאילתות SQL מלאות מראש כדי לבחור את נתוני ההדרכה עבור המודל החזוי. יכולות הכנת הנתונים האוטומטיות, הנדסת התכונות, בניית המודלים והפריסה של Pecan יכולות לבצע את שאר התהליך בזמן שיא, מהר יותר מכל פתרון דוגמנות חזוי אחר.

בקיצור, ה-Pecan's Predictive GenAI משתמש בכישורי השפה שאין שני להם של LLMs כדי להפוך את פלטפורמת הדוגמנות החזויה הטובה מסוגה שלנו לנגישה וידידותית הרבה יותר עבור משתמשים עסקיים. אנו נרגשים לראות כיצד גישה זו תעזור לחברות רבות נוספות להצליח עם AI.

אז, בעוד לימודי תואר שני לבד אינם מתאימים היטב להתמודד עם כל הצרכים החזויים שלך, הם יכולים למלא תפקיד רב עוצמה בקידום פרויקטי הבינה המלאכותית שלך. על ידי פירוש מקרה השימוש שלך ומתן לך התחלה עם קוד SQL שנוצר אוטומטית, Predictive GenAI של Pecan מוביל את הדרך באיחוד הטכנולוגיות הללו. אתה יכול בדוק את זה עכשיו עם ניסיון חינם.