אימות מבוסס טענה תופס רק בעיות שבגינן כתבת הצהרות. האם ישנה גישה משלימה לאיתור בעיות שלא שקלת בהן - הלא ידועים? פול קנינגהם (סמנכ"ל/מנכ"ל בכיר, אימות בקידנס), ראול קמפוסאנו (סיליקון קטליסט, יזם, לשעבר CTO של Synopsys וכיום CTO של Silvaco) ואני ממשיכים את הסדרה שלנו על רעיונות מחקר. כמו תמיד, משוב יתקבל בברכה.
החדשנות
הבחירה של החודש היא זיהוי אנומליה מבוסס למידת מכונה לאבחון באגים לאחר סיליקון. המאמר שפורסם בכנס DATE 2013. המחברים הם/היו מאוניברסיטת מישיגן.
שיטות זיהוי חריגות הן פופולריות כאשר אינך יכול לאפיין מראש את מה שאתה מחפש, בהונאת כרטיסי אשראי למשל או באבטחה בזמן אמת שבה הפריצות ממשיכות להתפתח. השיטה אוספת התנהגויות במהלך תקופת ניסיון, נבדקת באופן ידני כדי להיחשב במסגרת ההתנהגות הצפויה, ולאחר מכן מחפשת חריגים בבדיקות מתמשכות כבעיות אפשריות לבדיקה מדוקדקת יותר.
טכניקות זיהוי חריגות משתמשות בניתוחים סטטיסטיים או למידת מכונה. מאמר זה משתמש בלמידת מכונה כדי לבנות מודל של התנהגות צפויה. אתה יכול גם בקלות לדמיין את הניתוח הזה מועבר שמאלה לאימות טרום סיליקון.
השקפתו של פול
החודש הבאנו מאמר מלפני 10 שנים על שימוש בלמידת מכונה כדי לנסות ולנסות לגרום לאגמות שורש אוטומטיות באימות שלאחר סיליקון. זה קריאה מהנה ונראה כמו התאמה מצוינת לביקור חוזר עכשיו באמצעות DNNs או LLMs.
המחברים משווים באגים שלאחר סיליקון גורמים שורשיים לזיהוי הונאה בכרטיס אשראי: ניתן להתייחס לכל אות המתוקן בכל מחזור שעון כעסקת כרטיס אשראי, והבעיה של גורם שורש לבאג הופכת אנלוגית לזיהוי עסקת כרטיס אשראי הונאה. .
הגישה של המחברים הולכת כדלקמן: חלקו סימולציות לפרוסות זמן ועקבו אחר אחוז הזמן שכל אות ניפוי באגים לאחר מעקב אחר סיליקון גבוה בכל פרוסת זמן. לאחר מכן חלקו את האותות על סמך היררכיית המודולים, תוך שאיפה לגודל מודול של כ-500 אותות. עבור כל מודול בכל פרוסת זמן, הרכבת מודל של התפלגות ה"צפויה" של הזמנים הגבוהים של האות באמצעות קבוצה מוזהבת של עקבות לאחר סיליקון ללא באגים. מודל זה הוא קיבוץ פשוט מאוד של אמצעי k של האותות תוך שימוש בהפרש בזמנים גבוהים כ"מרחק" בין שני אותות.
עבור כל מבחן פוסט-סיליקון שנכשל, התפלגות האותות הגבוהה של % עבור כל מודול בכל פרוסת זמן מושווה למודל הזהב ומספר האותות שהזמן הגבוה שלהם נמצא מחוץ לקופסה התוחמת של אשכול המודל הזהוב שלו. אם המספר הזה חורג מסף רעש, אז האותות הללו בפרוסת זמן זו מסומנים כגורם השורש לכשל.
זה רעיון מגניב, אבל בעשרת מקרי הבדיקה של OpenSPARC, 30% מהבדיקות לא מדווחות על פרוסת הזמן או האותות הנכונים, וזה הרבה מדי גבוה מכדי להיות שימוש מעשי. אשמח לראות מה יקרה אם נעשה שימוש ב-LLM או DNN מודרניים במקום clustering פשוט של k-פירושים.
ההשקפה של ראול
זהו מאמר "מוקדם" משנת 2013 המשתמש בלמידה חישובית לזיהוי באגים לאחר סיליקון. לעת עתה זו חייבת להיות עבודה מתקדמת הרשומה עם 62 ציטוטים ב-Google Scholar.
הרעיון הוא פשוט קדימה: הפעל בדיקה פעמים רבות על עיצוב שלאחר סיליקון ורשום את התוצאות. כאשר מתרחשים באגים לסירוגין, ביצועים שונים של אותה בדיקה מניבים תוצאות שונות, חלקן עוברות וחלקן נכשלות. כשלים לסירוגין, לעתים קרובות עקב אירועים אסינכרוניים על השבב והשפעות חשמליות, הם מהקשים ביותר לאבחון. המחברים שוקלים בקצרה שימוש בלמידה מפוקחת, בפרט למידה מחלקה אחת (יש רק נתוני הדרכה חיוביים זמינים, באגים נדירים), אך פוסלים זאת כ"לא מתאים ליישום איתור באגים". במקום זאת, הם חלים k-פירושו התקבצות; תוצאות דומות מקובצות ל k אשכולות המורכבים מתוצאות "קרובות" הממזערות את מרחק סכום הריבועים בתוך אשכולות. העיתון חושף פרטים טכניים רבים הדרושים לשחזור התוצאות: התוצאות נרשמות כ"שבריר זמן ערך האות היה אחד במהלך שלב הזמן"; מספר האותות מתכנון, בסדר גודל של 10,000, הוא הממדיות ב k-פירושו אשכול שהוא NP-קשה ביחס למספר הממדים, כך שמספר האותות מוגבל ל-500 באמצעות ניתוח רכיבים עיקריים; מספר האשכולות לא יכול להיות קטן מדי (לא מתאים) וגם לא גדול מדי (התאמת יתר); יש לבחור סף ראוי לגילוי חריגות, מבוטא כאחוז מסך כל הדוגמאות הכושלות הנחשבות; לוקליזציה בזמן של באג מושגת על ידי זיהוי אנומליה דו-שלבי, זיהוי איזה שלב זמן מציג מספר מספיק של חריגות כדי לחשוף את התרחשות הבאג ולאחר מכן בסיבוב שני זיהוי אותות הבאגים האחראים.
ניסויים עבור עיצוב OpenSPARC T2 של כ-500 מיליון טרנזיסטורים הריצו 10 עומסי עבודה של אורכי בדיקה שנעו בין 60,000 ל-1.2 מיליון מחזורים 100 פעמים כל אחד כאימונים. ואז הם הזריקו 10 שגיאות והריצו 1000 בדיקות באגי. בממוצע זוהו 347 אותות לבאג (הנע בין אף אחד ל-1000) וזה לקח ~350 מחזורי השהייה מהזרקת באג לזיהוי באג. מספר האשכולות וסף הזיהוי משפיעים מאוד על התוצאות, וכך גם כמות נתוני האימון. תוצאות חיוביות שגויות ושליליות שגויות הסתכמו ב-30-40 (ב-1000 בדיקות באגי).
למרות שהכותבים מציינים כי "בסך הכל, מבין 41,743 האותות ברמה העליונה של OpenSPARC T2, אלגוריתם זיהוי האנומליות זיהה 347, בממוצע על פני הבאגים. זה מייצג 0.8% מסך האותות. לפיכך, הגישה שלנו מסוגלת לצמצם את מאגר האותות ב-99.2%", בפועל זה אולי לא יעזור מאוד למעצב מנוסה. 10 שנים חלפו, יהיה מעניין לחזור על העבודה הזו באמצעות יכולות למידת מכונה של ימינו, למשל LLMs לזיהוי אנומליות.
שתף את הפוסט הזה באמצעות:
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. רכב / רכבים חשמליים, פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- ChartPrime. הרם את משחק המסחר שלך עם ChartPrime. גישה כאן.
- BlockOffsets. מודרניזציה של בעלות על קיזוז סביבתי. גישה כאן.
- מקור: https://semiwiki.com/artificial-intelligence/333404-anomaly-detection-through-ml-innovation-in-verification/
- :הוא
- :לֹא
- :איפה
- $ למעלה
- 000
- 1
- 10
- 100
- 2013
- 300
- 500
- 60
- a
- יכול
- אודות
- הושג
- הוסיף
- מתקדם
- שוב
- לִפנֵי
- מכוון
- אַלגוֹרִיתְם
- גם
- תמיד
- בין
- an
- אנליזה
- ו
- גילוי חריגות
- כל
- בקשה
- החל
- גישה
- ARE
- סביב
- AS
- At
- מחברים
- באופן אוטומטי
- זמין
- מְמוּצָע
- מבוסס
- BE
- הופך להיות
- היה
- להיות
- מדוד
- בֵּין
- אריזה מקורית
- בקצרה
- חרק
- באגים
- לִבנוֹת
- אבל
- by
- קיידנס
- CAN
- יכולות
- כרטיס
- זרז
- לגרום
- גורם
- שעון
- קרוב יותר
- אשכול
- קיבוץ
- לעומת
- משלימה
- רְכִיב
- כנס
- לשקול
- התחשבות
- נחשב
- מורכב
- להמשיך
- קריר
- לתקן
- יכול
- אשראי
- כרטיס אשראי
- ראש אגף טכנולוגיה
- מחזור
- מחזורי
- נתונים
- תַאֲרִיך
- עיצוב
- מְעַצֵב
- פרטים
- זוהה
- איתור
- הבדל
- אחר
- קשה
- ממדים
- מרחק
- הפצה
- do
- עושה
- ראוי
- בְּמַהֲלָך
- כל אחד
- בקלות
- תופעות
- או
- יזם
- שגיאות
- אירועים
- כל
- להתפתח
- דוגמה
- דוגמאות
- צפוי
- מנוסה
- ביטא
- אי
- כשלון
- שקר
- מָשׁוֹב
- מתאים
- מסומן
- כדלקמן
- בעד
- לשעבר
- קדימה
- הונאה
- גילוי הונאה
- רמאי
- חופשי
- החל מ-
- כֵּיף
- Goes
- זָהוּב
- טוב
- גדול
- פריצות
- לקרות
- יש
- לעזור
- היררכיה
- גָבוֹהַ
- HTTPS
- i
- רעיון
- רעיונות
- מזוהה
- זיהוי
- IEEE
- if
- תמונה
- in
- להשפיע
- חדשנות
- במקום
- מעניין
- אל תוך
- IT
- שֶׁלָה
- גָדוֹל
- חֶבִיוֹן
- למידה
- עזבו
- כמו
- ברשימה
- לוקליזציה
- הסתכלות
- נראה
- אהבה
- מכונה
- למידת מכונה
- באופן ידני
- רב
- להתאים
- max-width
- מאי..
- שיטה
- שיטות
- מישיגן
- מִילִיוֹן
- מזעור
- ML
- מודל
- מודרני
- מודול
- חוֹדֶשׁ
- רוב
- צריך
- הכרחי
- צרכי
- תשלילים
- חדש
- רעש
- ללא חתימה
- ולא
- עַכשָׁיו
- מספר
- רב
- להתבונן
- להתרחש
- of
- לעתים קרובות
- on
- ONE
- מתמשך
- רק
- or
- להזמין
- שלנו
- בחוץ
- יותר
- מאמר
- מסוים
- עבר
- חולף
- פול
- אָחוּז
- אחוזים
- תקופה
- לבחור
- הרים
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- בריכה
- פופולרי
- חיובי
- הודעה
- פוטנציאל
- מעשי
- תרגול
- מתנות
- מנהל
- בעיה
- בעיות
- תָקִין
- לאור
- כמות
- טִוּוּחַ
- נדיר
- חומר עיוני
- זמן אמת
- שיא
- מוקלט
- להפחית
- לחזור על
- לדווח
- מייצג
- מחקר
- כבוד
- אחראי
- תוצאות
- לגלות
- מגלה
- סקירה
- שורש
- עגול
- הפעלה
- אותו
- מלומד
- שְׁנִיָה
- אבטחה
- לִרְאוֹת
- לחצני מצוקה לפנסיונרים
- סדרה
- סט
- זז
- לאותת
- הפצת אותות
- אותות
- סיליקון
- דומה
- פָּשׁוּט
- מידה
- פרוסה
- קטן
- So
- כמה
- סטטיסטי
- שלב
- ישר
- בְּתוֹקֶף
- מספיק
- למידה מפוקחת
- טכני
- טכניקות
- עשר
- מבחן
- בדיקות
- בדיקות
- זֶה
- השמיים
- אז
- שם.
- הֵם
- זֶה
- אלה
- אם כי?
- מחשבה
- סף
- דרך
- כָּך
- זמן
- פִּי
- ל
- של היום
- גַם
- לקח
- הרמה העליונה
- סה"כ
- לעקוב
- רכבת
- הדרכה
- עסקה
- מִשׁפָּט
- לנסות
- שתיים
- תחת
- אוניברסיטה
- אוניברסיטת מישיגן
- לא ידוע
- להשתמש
- מְשׁוּמָשׁ
- שימושים
- באמצעות
- אימות
- ערך
- אימות
- מאוד
- באמצעות
- היה
- דֶרֶך..
- ברוך הבא
- היו
- מה
- מתי
- אשר
- של מי
- עם
- בתוך
- תיק עבודות
- היה
- כתוב
- שנים
- תְשׁוּאָה
- אתה
- זפירנט