זהו פוסט משותף שנכתב על ידי AWS ו-Voxel51. Voxel51 היא החברה מאחורי FiftyOne, ערכת הכלים בקוד פתוח לבניית מערכי נתונים איכותיים ומודלים של ראייה ממוחשבת.
חברה קמעונאית בונה אפליקציה לנייד כדי לעזור ללקוחות לקנות בגדים. כדי ליצור את האפליקציה הזו, הם צריכים מערך נתונים באיכות גבוהה המכיל תמונות לבוש, המסומנות בקטגוריות שונות. בפוסט זה, אנו מראים כיצד ליישם מחדש מערך נתונים קיים באמצעות ניקוי נתונים, עיבוד מקדים ותיוג מראש עם מודל סיווג אפס ב- חמישים ואחד, והתאמת התוויות הללו עם האמת של אמזון SageMaker.
אתה יכול להשתמש ב-Ground Truth וב-FiftyOne כדי להאיץ את פרויקט תיוג הנתונים שלך. אנו ממחישים כיצד להשתמש בצורה חלקה בשני היישומים יחד כדי ליצור מערכי נתונים מתויגים באיכות גבוהה. במקרה השימוש לדוגמה שלנו, אנו עובדים עם ה מערך נתונים של Fashion200K, שוחרר ב-ICCV 2017.
סקירת פתרונות
Ground Truth הוא שירות תיוג נתונים בשירות עצמי ומנוהל באופן מלא, המאפשר למדעני נתונים, מהנדסי למידת מכונה (ML) וחוקרים לבנות מערכי נתונים באיכות גבוהה. חמישים ואחד by ווקסל 51 הוא ערכת כלים בקוד פתוח לאיסוף, הדמיה והערכת מערכי נתונים של ראיית מחשב, כך שתוכל לאמן ולנתח מודלים טובים יותר על ידי האצת מקרי השימוש שלך.
בסעיפים הבאים, אנו מדגימים כיצד לבצע את הפעולות הבאות:
- דמיין את מערך הנתונים ב-FiftyOne
- נקה את מערך הנתונים עם סינון ומניעת כפילות תמונות ב-FiftyOne
- סמן מראש את הנתונים שנקו עם סיווג אפס-shot ב-FiftyOne
- סמן את מערך הנתונים הקטן יותר עם Ground Truth
- הזרקו תוצאות מתויגות מ-Ground Truth לתוך FiftyOne וסקור את התוצאות המסומנות ב-FiftyOne
השתמש בסקירת המקרים
נניח שאתה הבעלים של חברה קמעונאית וברצונך לבנות אפליקציה לנייד כדי לתת המלצות מותאמות אישית כדי לעזור למשתמשים להחליט מה ללבוש. המשתמשים הפוטנציאליים שלך מחפשים אפליקציה שאומרת להם אילו פריטי לבוש בארון שלהם עובדים טוב ביחד. אתה רואה כאן הזדמנות: אם אתה יכול לזהות תלבושות טובות, אתה יכול להשתמש בזה כדי להמליץ על פריטי לבוש חדשים המשלימים את הבגדים שכבר בבעלות הלקוח.
אתה רוצה לעשות דברים קלים ככל האפשר עבור משתמש הקצה. באופן אידיאלי, מישהו שמשתמש באפליקציה שלך צריך רק לצלם תמונות של הבגדים בארון הבגדים שלו, ודגמי ה-ML שלך עושים את הקסם שלהם מאחורי הקלעים. אתה יכול לאמן מודל לשימוש כללי או לכוונן מודל לסגנון הייחודי של כל משתמש עם צורה כלשהי של משוב.
עם זאת, ראשית, עליך לזהות איזה סוג של לבוש המשתמש לוכד. זה חולצה? זוג מכנסיים? או משהו אחר? אחרי הכל, אתה כנראה לא רוצה להמליץ על בגד שיש לו מספר שמלות או מספר כובעים.
כדי להתמודד עם האתגר הראשוני הזה, אתה רוצה ליצור מערך הדרכה המורכב מתמונות של פריטי לבוש שונים עם דפוסים וסגנונות שונים. כדי לאבטיפוס עם תקציב מוגבל, אתה רוצה לבצע אתחול באמצעות מערך נתונים קיים.
כדי להמחיש ולהדריך אותך בתהליך בפוסט זה, אנו משתמשים במערך הנתונים של Fashion200K ששוחרר ב-ICCV 2017. זהו מערך נתונים מבוסס ומצוטט היטב, אך הוא אינו מתאים ישירות למקרה השימוש שלך.
למרות שפריטי לבוש מסומנים בקטגוריות (ותתי קטגוריות) ומכילים מגוון תגים מועילים המופקים מתיאורי המוצר המקוריים, הנתונים אינם מסומנים באופן שיטתי עם מידע על דפוס או סגנון. המטרה שלך היא להפוך את מערך הנתונים הקיים הזה למערך אימון חזק עבור דגמי סיווג הבגדים שלך. אתה צריך לנקות את הנתונים, להגדיל את סכימת התוויות עם תוויות בסגנון. ואתה רוצה לעשות זאת מהר ועם כמה שפחות הוצאה.
הורד את הנתונים באופן מקומי
ראשית, הורד את קובץ ה-zip women.tar ואת תיקיית התוויות (עם כל תיקיות המשנה שלה) לפי ההוראות המפורטות ב- מאגר GitHub של מערך נתונים Fashion200K. לאחר שפתחת את שניהם, צור ספריית אב fashion200k, והעבר את התוויות ותיקיות הנשים אליה. למרבה המזל, תמונות אלו כבר נחתכו לתיבות התוחמות של זיהוי אובייקטים, כך שנוכל להתמקד בסיווג, במקום לדאוג לזיהוי אובייקטים.
למרות ה-"200K" בכינויו, ספריית הנשים שחילצנו מכילה 338,339 תמונות. כדי ליצור את מערך הנתונים הרשמי של Fashion200K, מחברי מערך הנתונים סרקו יותר מ-300,000 מוצרים באינטרנט, ורק מוצרים עם תיאורים המכילים יותר מארבע מילים הגיעו לגזרה. למטרותינו, כאשר תיאור המוצר אינו חיוני, נוכל להשתמש בכל התמונות שנסרקו.
הבה נבחן כיצד הנתונים הללו מאורגנים: בתוך תיקיית הנשים, התמונות מסודרות לפי סוג מאמר ברמה העליונה (חצאיות, עליוניות, מכנסיים, ז'קטים ושמלות), ותת-קטגוריית סוג מאמר (חולצות, חולצות טי, שרוולים ארוכים עליוניות).
בתוך ספריות קטגוריות המשנה, ישנה ספריית משנה לכל רישום מוצר. כל אחת מהן מכילה מספר משתנה של תמונות. קטגוריית המשנה cropped_pants, למשל, מכילה את רישומי המוצרים הבאים והתמונות המשויכות.
תיקיית התוויות מכילה קובץ טקסט עבור כל סוג מאמר ברמה העליונה, עבור פיצולי רכבת וניסויים כאחד. בתוך כל אחד מקבצי הטקסט הללו יש שורה נפרדת לכל תמונה, המציינת את נתיב הקובץ היחסי, ניקוד ותגים מתיאור המוצר.
מכיוון שאנו מייעדים מחדש את מערך הנתונים, אנו משלבים את כל תמונות הרכבת והבדיקות. אנו משתמשים בהם כדי ליצור מערך נתונים איכותי במיוחד ליישום. לאחר שנשלים תהליך זה, נוכל לפצל באופן אקראי את מערך הנתונים המתקבל לרכבת חדשה ולבחון פיצולים.
הזרקו, הצג ואצור מערך נתונים ב-FiftyOne
אם עדיין לא עשית זאת, התקן קוד פתוח FiftyOne באמצעות pip:
שיטה מומלצת היא לעשות זאת בתוך סביבה וירטואלית חדשה (venv או conda). לאחר מכן ייבא את המודולים הרלוונטיים. יבא את ספריית הבסיס, fiftyone, ה-FiftyOne Brain, שיש לו שיטות ML מובנות, גן החיות FiftyOne, ממנו נטען מודל שייצור עבורנו תוויות צילום אפס, ו-ViewField, המאפשר לנו לסנן ביעילות את נתונים במערך הנתונים שלנו:
אתה גם רוצה לייבא את מודולי glob ו-OS Python, שיעזרו לנו לעבוד עם נתיבים והתאמת דפוסים על פני תוכן הספרייה:
עכשיו אנחנו מוכנים לטעון את מערך הנתונים לתוך FiftyOne. ראשית, אנו יוצרים מערך נתונים בשם fashion200k והופכים אותו לעמיד, מה שמאפשר לנו לשמור את התוצאות של פעולות אינטנסיביות מבחינה חישובית, כך שאנו צריכים לחשב את הכמויות האמורות רק פעם אחת.
כעת אנו יכולים לעבור דרך כל ספריות קטגוריות המשנה, ולהוסיף את כל התמונות בתוך ספריות המוצרים. אנו מוסיפים תווית סיווג FiftyOne לכל דוגמה עם שם השדה article_type, המאוכלס בקטגוריית המאמר ברמה העליונה של התמונה. אנו גם מוסיפים מידע על קטגוריות ותת-קטגוריות כתגיות:
בשלב זה, אנו יכולים לדמיין את מערך הנתונים שלנו באפליקציית FiftyOne על ידי השקת הפעלה:
אנו יכולים גם להדפיס סיכום של מערך הנתונים ב- Python על ידי ריצה print(dataset)
:
אנחנו יכולים גם להוסיף את התגים מה- labels
ספרייה לדוגמאות במערך הנתונים שלנו:
כשמסתכלים על הנתונים, מתבררים כמה דברים:
- חלק מהתמונות מגורעות למדי, ברזולוציה נמוכה. סביר להניח שהסיבה לכך היא שהתמונות הללו נוצרו על ידי חיתוך תמונות ראשוניות בתיבות תוחמות לזיהוי אובייקט.
- חלק מהבגדים לובשים על ידי אדם, וחלק מצולמים לבד. פרטים אלה מובלעים על ידי
viewpoint
נכס. - הרבה מהתמונות של אותו מוצר דומות מאוד, כך שלפחות בהתחלה, הכללת יותר מתמונה אחת למוצר עשויה שלא להוסיף כוח חיזוי רב. לרוב, התמונה הראשונה של כל מוצר (מסתיימת ב
_0.jpeg
) הוא הנקי ביותר.
בתחילה, אולי נרצה לאמן את מודל סיווג סגנון הלבוש שלנו על תת-קבוצה מבוקרת של תמונות אלו. לשם כך, אנו משתמשים בתמונות ברזולוציה גבוהה של המוצרים שלנו, ומגבילים את התצוגה שלנו למדגם מייצג אחד לכל מוצר.
ראשית, אנו מסננים את התמונות ברזולוציה נמוכה. אנו משתמשים ב- compute_metadata()
שיטה לחישוב ולאחסן רוחב וגובה התמונה, בפיקסלים, עבור כל תמונה במערך הנתונים. לאחר מכן אנו מעסיקים את FiftyOne ViewField
לסנן תמונות על סמך ערכי הרוחב והגובה המינימליים המותרים. ראה את הקוד הבא:
תת-קבוצה זו ברזולוציה גבוהה כוללת קצת פחות מ-200,000 דגימות.
מתצוגה זו, אנו יכולים ליצור תצוגה חדשה לתוך מערך הנתונים שלנו המכילה רק מדגם מייצג אחד (לכל היותר) עבור כל מוצר. אנו משתמשים ב- ViewField
שוב, התאמת דפוסים עבור נתיבי קבצים שמסתיימים ב _0.jpeg
:
בואו נצפה בסדר אקראי של תמונות בתת-קבוצה זו:
הסר תמונות מיותרות במערך הנתונים
תצוגה זו מכילה 66,297 תמונות, או קצת יותר מ-19% ממערך הנתונים המקורי. אולם כאשר אנו מסתכלים על הנוף, אנו רואים שיש הרבה מוצרים דומים מאוד. שמירה על כל העותקים הללו ככל הנראה רק תוסיף עלות לתיוג ולהכשרת המודלים שלנו, מבלי לשפר באופן ניכר את הביצועים. במקום זאת, בואו נפטר מהכפילויות הקרובות כדי ליצור מערך נתונים קטן יותר שעדיין מכיל את אותו אגרוף.
מכיוון שתמונות אלו אינן כפילויות מדויקות, איננו יכולים לבדוק שוויון פיקסל. למרבה המזל, אנו יכולים להשתמש ב-FiftyOne Brain כדי לעזור לנו לנקות את מערך הנתונים שלנו. במיוחד, נחשב הטבעה עבור כל תמונה - וקטור במימד נמוך יותר המייצג את התמונה - ולאחר מכן נחפש תמונות שהווקטורים המוטבעים שלהן קרובים זה לזה. ככל שהווקטורים קרובים יותר, כך התמונות דומות יותר.
אנו משתמשים במודל CLIP כדי ליצור וקטור הטבעה 512 מימדים עבור כל תמונה, ומאחסנים את ההטמעות הללו בהטבעות השדה על הדוגמאות במערך הנתונים שלנו:
לאחר מכן אנו מחשבים את הקרבה בין הטבעות, באמצעות דמיון קוסינוס, וקבע שכל שני וקטורים שהדמיון ביניהם גדול מסף כלשהו צפויים להיות קרובים לכפולים. ציוני הדמיון בקוסינוס נמצאים בטווח [0, 1], ובהסתכלות על הנתונים, נראה שציון סף של thresh=0.5 הוא בערך נכון. שוב, זה לא צריך להיות מושלם. כמה תמונות כמעט משוכפלות לא צפויות להרוס את כוח הניבוי שלנו, והשלכת כמה תמונות לא משוכפלות לא משפיעה מהותית על ביצועי המודל.
אנו יכולים לראות את הכפילויות לכאורה כדי לוודא שהם אכן מיותרים:
כאשר אנו מרוצים מהתוצאה ומאמינים שהתמונות הללו אכן כמעט כפילויות, אנו יכולים לבחור דוגמה אחת מכל סט של דגימות דומות לשמירה, ולהתעלם מהאחרות:
כעת יש לתצוגה זו 3,729 תמונות. על ידי ניקוי הנתונים וזיהוי תת-קבוצה איכותית של מערך הנתונים של Fashion200K, FiftyOne מאפשר לנו להגביל את המיקוד שלנו מיותר מ-300,000 תמונות לקצת פחות מ-4,000, מה שמייצג הפחתה של 98%. השימוש בהטמעות להסרת תמונות כמעט משוכפלות בלבד הוריד את מספר התמונות הכולל שלנו בבחינה ביותר מ-90%, עם השפעה מועטה אם בכלל על דגמים כלשהם שיש להכשיר על נתונים אלה.
לפני תיוג מראש של תת-קבוצה זו, נוכל להבין טוב יותר את הנתונים על ידי הדמיית ההטמעות שכבר חישבנו. אנחנו יכולים להשתמש ב-FiftyOne Brain המובנה compute_visualization(
) שיטת, שמשתמשת בטכניקת הקירוב הסעפת אחיד (UMAP) כדי להקרין את וקטורי הטבעה ב-512 מימדים לתוך המרחב הדו-ממדי כדי שנוכל לדמיין אותם:
אנחנו פותחים חדש פאנל הטמעות באפליקציית FiftyOne וצביעה לפי סוג מאמר, ואנו יכולים לראות שההטבעות הללו מקודדות בערך מושג של סוג מאמר (בין היתר!).
כעת אנו מוכנים לסמן מראש את הנתונים הללו.
כשבודקים את התמונות הייחודיות ביותר, ברזולוציה גבוהה, נוכל ליצור רשימה ראשונית הגונה של סגנונות לשימוש כמחלקות בסיווג אפס צילום מראש שלנו. המטרה שלנו בתיוג מראש של תמונות אלו היא לא בהכרח לתייג כל תמונה בצורה נכונה. במקום זאת, המטרה שלנו היא לספק נקודת התחלה טובה עבור כותבים אנושיים כדי שנוכל להפחית את זמן התיוג ואת העלות.
לאחר מכן נוכל ליצור מודל סיווג אפס עבור יישום זה. אנו משתמשים במודל CLIP, שהוא מודל לשימוש כללי המאומן על תמונות ושפה טבעית כאחד. אנו מייצרים מודל CLIP עם הנחיית הטקסט "לבוש בסגנון", כך שבהינתן תמונה, הדגם יוציא את המחלקה שעבורה "לבוש בסגנון [קלאס]" מתאים ביותר. CLIP אינו מיומן על נתונים ספציפיים לקמעונאות או לאופנה, כך שזה לא יהיה מושלם, אבל זה יכול לחסוך לך בעלויות תיוג והערות.
לאחר מכן אנו מיישמים את המודל הזה על המשנה המופחתת שלנו ומאחסנים את התוצאות ב-an article_style
שדה:
השקת אפליקציית FiftyOne שוב, נוכל לדמיין את התמונות עם תוויות הסגנון החזוי הללו. אנו ממיינים לפי בטחון חיזוי, כך שאנו רואים תחילה את תחזיות הסגנון הבטוחות ביותר:
אנו יכולים לראות כי תחזיות הביטחון הגבוהות ביותר הן עבור סגנונות "ג'רזי", "הדפס חיות", "מנוקד" וסגנונות "אותיות". זה הגיוני, כי סגנונות אלה הם יחסית שונים. זה גם נראה כאילו, לרוב, תוויות הסגנון החזוי מדויקות.
אנו יכולים גם להסתכל על תחזיות סגנון הביטחון הנמוך ביותר:
עבור חלק מהתמונות הללו, קטגוריית הסגנון המתאימה נמצאת ברשימה המסופקת, וחפץ הלבוש מסומן בצורה שגויה. התמונה הראשונה ברשת, למשל, צריכה להיות בבירור "הסוואה" ולא "שברון". עם זאת, במקרים אחרים, המוצרים אינם מתאימים היטב לקטגוריות הסגנונות. השמלה בתמונה השנייה בשורה השנייה, למשל, אינה בדיוק "מפוספסת", אבל בהינתן אותן אפשרויות תיוג, ייתכן שגם כותב אנושי היה מסוכסך. בזמן שאנו בונים את מערך הנתונים שלנו, עלינו להחליט אם להסיר מקרי קצה כמו אלה, להוסיף קטגוריות סגנון חדשות או להגדיל את מערך הנתונים.
ייצא את מערך הנתונים הסופי מ-FiftyOne
ייצא את מערך הנתונים הסופי עם הקוד הבא:
אנחנו יכולים לייצא מערך נתונים קטן יותר, למשל, 16 תמונות, לתיקיה 200kFashionDatasetExportResult-16Images
. אנו יוצרים עבודת התאמת Ground Truth באמצעותו:
העלה את מערך הנתונים המתוקן, המר את פורמט התווית ל-Ground Truth, העלה לאמזון S3 וצור קובץ מניפסט עבור עבודת ההתאמה
אנו יכולים להמיר את התוויות במערך הנתונים כך שיתאימו ל סכימת מניפסט פלט של עבודת Ground Truth bounding box, והעלה את התמונות ל- שירות אחסון פשוט של אמזון (Amazon S3) דלי לשיגור א עבודת התאמת Ground Truth:
העלה את קובץ המניפסט לאמזון S3 עם הקוד הבא:
צור תוויות בסגנון מתוקן עם Ground Truth
כדי להוסיף הערות לנתונים שלך עם תוויות סגנון באמצעות Ground Truth, השלם את השלבים הדרושים כדי להתחיל עבודת תיוג תיוג תוחמת על ידי ביצוע ההליך המתואר ב- תחילת העבודה עם Ground Truth מדריך עם מערך הנתונים באותו דלי S3.
- בקונסולת SageMaker, צור עבודת תיוג Ground Truth.
- הגדר את הזן את מיקום הנתונים להיות המניפסט שיצרנו בשלבים הקודמים.
- ציין נתיב S3 עבור מיקום מערך פלט.
- בעד תפקיד IAM, בחר הזן תפקיד IAM מותאם אישית רנ"א, ואז היכנס לתפקיד ARN.
- בעד קטגוריית המשימות, בחר תמונה ובחר תיבה תוחמת.
- לבחור הַבָּא.
- ב עובדים בחר את סוג כוח העבודה שבו תרצה להשתמש.
אתה יכול לבחור כוח עבודה דרך אמזון מכני, ספקי צד שלישי או כוח העבודה הפרטי שלך. לפרטים נוספים על אפשרויות כוח העבודה שלך, ראה צור ונהל כוח אדם. - לְהַרְחִיב אפשרויות תצוגה של תוויות קיימות ובחר אני רוצה להציג תוויות קיימות ממערך הנתונים עבור עבודה זו.
- בעד מאפיין תווית שם, בחר את השם מהמניפסט שלך שמתאים לתוויות שברצונך להציג לצורך התאמה.
תראה רק שמות של תכונות תוויות עבור תוויות התואמות לסוג המשימה שבחרת בשלבים הקודמים. - הזן ידנית את התוויות עבור כלי תיוג תיוג תיוג.
התוויות חייבות להכיל את אותן התוויות המשמשות במערך הנתונים הציבורי. אתה יכול להוסיף תוויות חדשות. צילום המסך הבא מראה כיצד תוכל לבחור את העובדים ולהגדיר את הכלי עבור עבודת התיוג שלך. - לבחור תצוגה מקדימה לתצוגה מקדימה של התמונה וההערות המקוריות.
יצרנו כעת עבודת תיוג ב-Ground Truth. לאחר השלמת העבודה שלנו, נוכל לטעון את הנתונים המסומנים החדשים שנוצרו לתוך FiftyOne. Ground Truth מייצר נתוני פלט במניפסט פלט Ground Truth. לפרטים נוספים על קובץ המניפסט של הפלט, ראה תפוקת עבודה של תיבה תוחמת. הקוד הבא מציג דוגמה לפורמט מניפסט פלט זה:
סקור את התוצאות המסומנות מ-Ground Truth ב-FiftyOne
לאחר השלמת העבודה, הורד את מניפסט הפלט של עבודת התיוג מאמזון S3.
קרא את קובץ המניפסט של הפלט:
צור מערך נתונים של FiftyOne והמר את שורות המניפסט לדוגמאות במערך הנתונים:
כעת תוכל לראות נתונים מתויגים באיכות גבוהה מ-Ground Truth ב-FiftyOne.
סיכום
בפוסט זה, הראינו כיצד לבנות מערכי נתונים באיכות גבוהה על ידי שילוב הכוח של חמישים ואחד by ווקסל 51, ערכת כלים בקוד פתוח המאפשרת לך לנהל, לעקוב, להמחיש ולאצור את מערך הנתונים שלך, ו-Ground Truth, שירות תיוג נתונים המאפשר לך לתייג בצורה יעילה ומדויקת את מערכי הנתונים הנדרשים להכשרת מערכות ML על ידי מתן גישה למספר מערכות בנויות. -בתבניות משימות וגישה לכוח עבודה מגוון באמצעות Mechanical Turk, ספקי צד שלישי או כוח עבודה פרטי משלך.
אנו ממליצים לך לנסות את הפונקציונליות החדשה הזו על ידי התקנת מופע FiftyOne ושימוש בקונסולת Ground Truth כדי להתחיל. למידע נוסף על Ground Truth, עיין ב נתוני תווית, שאלות נפוצות לגבי תיוג נתונים של אמזון SageMaker, וה בלוג למידת מכונות AWS.
התחבר עם ה- קהילת למידת מכונה ובינה מלאכותית אם יש לך שאלות או משוב!
הצטרף לקהילת FiftyOne!
הצטרף לאלפי המהנדסים ומדעני הנתונים שכבר משתמשים ב-FiftyOne כדי לפתור כמה מהבעיות המאתגרות ביותר בראייה ממוחשבת כיום!
על הכותבים
שלנדרה צ'הברה הוא כיום ראש ניהול מוצר עבור שירותי אמזון SageMaker Human-in-the-Loop (HIL). בעבר, שלנדרה הדמיעה והובילה אינטליגנציה של שפה ושיחה לפגישות של Microsoft Teams, הייתה EIR ב-Amazon Alexa Techstars Startup Accelerator, סמנכ"לית מוצר ושיווק ב- Discuss.io, ראש תחום מוצר ושיווק ב-Clipboard (נרכש על ידי Salesforce), ומנהל מוצר מוביל ב-Swype (נרכש על ידי Nuance). בסך הכל, שלנדרה סייעה לבנות, לשלוח ולשווק מוצרים שנגעו ליותר ממיליארד חיים.
יעקב מרקס הוא מהנדס למידת מכונה ואוונגליסט מפתחים ב-Voxel51, שם הוא עוזר להביא שקיפות ובהירות לנתוני העולם. לפני שהצטרף ל-Voxel51, ג'ייקוב הקים סטארט-אפ כדי לעזור למוזיקאים מתעוררים להתחבר ולשתף תוכן יצירתי עם מעריצים. לפני כן, הוא עבד ב-Google X, Samsung Research ו-Wolfram Research. בחיים קודמים, ג'ייקוב היה פיזיקאי תיאורטי, והשלים את הדוקטורט שלו בסטנפורד, שם חקר שלבים קוונטיים של החומר. בזמנו הפנוי, יעקב נהנה לטפס, לרוץ ולקרוא רומני מדע בדיוני.
ג'ייסון קורסו הוא מייסד שותף ומנכ"ל של Voxel51, שם הוא מנהל את האסטרטגיה לעזור להביא שקיפות ובהירות לנתוני העולם באמצעות תוכנה גמישה מתקדמת. הוא גם פרופסור לרובוטיקה, הנדסת חשמל ומדעי המחשב באוניברסיטת מישיגן, שם הוא מתמקד בבעיות חדישות בצומת של ראייה ממוחשבת, שפה טבעית ופלטפורמות פיזיות. בזמנו הפנוי, ג'ייסון נהנה לבלות עם משפחתו, לקרוא, להיות בטבע, לשחק במשחקי לוח וכל מיני פעילויות יצירתיות.
בריאן מור הוא מייסד שותף ו-CTO של Voxel51, שם הוא מוביל אסטרטגיה טכנית וחזון. הוא בעל תואר דוקטור בהנדסת חשמל מאוניברסיטת מישיגן, שם המחקר שלו התמקד באלגוריתמים יעילים לבעיות למידת מכונה בקנה מידה גדול, עם דגש מיוחד על יישומי ראייה ממוחשבת. בזמנו הפנוי, הוא נהנה מבדמינטון, גולף, טיולים ומשחק עם תאומי יורקשייר טרייר.
ז'ולינג באי הוא מהנדס פיתוח תוכנה ב- Amazon Web Services. היא עובדת על פיתוח מערכות מבוזרות בקנה מידה גדול לפתרון בעיות למידת מכונה.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoAiStream. Web3 Data Intelligence. הידע מוגבר. גישה כאן.
- הטבעת העתיד עם אדריאן אשלי. גישה כאן.
- קנה ומכירה של מניות בחברות PRE-IPO עם PREIPO®. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/create-high-quality-datasets-with-amazon-sagemaker-ground-truth-and-fiftyone/
- :יש ל
- :הוא
- :לֹא
- :איפה
- $ למעלה
- 000
- 1
- 10
- 11
- 110
- 13
- 14
- 20
- 200
- 2017
- 23
- 24
- 250
- 28
- 30
- 500
- 66
- 7
- 8
- 9
- a
- אודות
- להאיץ
- מאיצה
- מאיץ
- גישה
- מדויק
- במדויק
- נרכש
- פעילויות
- להוסיף
- מוסיף
- כתובת
- מותאם
- התאמה
- לאחר
- שוב
- AI
- Alexa
- אלגוריתמים
- תעשיות
- מאפשר
- לבד
- כְּבָר
- גם
- אמזון בעברית
- אמזון
- אמזון SageMaker
- האמת של אמזון SageMaker
- אמזון שירותי אינטרנט
- בין
- an
- לנתח
- ו
- בעלי חיים
- כל
- האפליקציה
- בקשה
- יישומים
- החל
- מתאים
- ARE
- מְסוּדָר
- מאמר
- מאמרים
- AS
- המשויך
- At
- מחברים
- רָחוֹק
- AWS
- בסיס
- מבוסס
- BE
- כי
- להיות
- היה
- לפני
- מאחור
- מאחורי הקלעים
- להיות
- תאמינו
- הטוב ביותר
- מוטב
- בֵּין
- B
- לוּחַ
- משחקי לוח
- עֶצֶם
- אוזן נעל
- שניהם
- אריזה מקורית
- תיבות
- מוֹחַ
- לשבור
- להביא
- מובא
- תקציב
- לִבנוֹת
- בִּניָן
- מובנה
- אבל
- לִקְנוֹת
- by
- CAN
- לכידה
- מקרה
- מקרים
- קטגוריות
- קטגוריה
- מנכ"ל
- לאתגר
- אתגר
- לבדוק
- לבחור
- בהירות
- בכיתה
- כיתות
- מיון
- ניקוי
- ברור
- בבירור
- לקוחות
- טיפוס
- סְגוֹר
- קרוב יותר
- בגדים
- ביגוד
- מייסד שותף
- קוד
- לשלב
- שילוב
- חברה
- השלמה
- להשלים
- מַשׁלִים
- לחשב
- המחשב
- מדעי מחשב
- ראייה ממוחשבת
- יישומי ראייה ממוחשבת
- אמון
- בטוח
- לְחַבֵּר
- התחשבות
- מורכב
- קונסול
- מכיל
- תוכן
- תוכן
- נשלט
- שיחה
- להמיר
- עותקים
- ליבה
- תוקן
- מתכתב
- עלות
- עלויות
- לִיצוֹר
- נוצר
- יְצִירָתִי
- אישורים
- ראש אגף טכנולוגיה
- אוצר
- אוצר
- כיום
- מנהג
- לקוח
- לקוחות
- חותך
- שיא הטכנולוגיה
- נתונים
- מערכי נתונים
- להחליט
- להפגין
- ג 'ינס
- עומק
- תיאור
- פרטים
- איתור
- מפתח
- מתפתח
- צעצועי התפתחות
- אחר
- ישירות
- ספריות
- לְהַצִיג
- מובהק
- מופץ
- מערכות מבוזרות
- שונה
- do
- לא
- כֶּלֶב
- עושה
- עשה
- לא
- נקודה
- מטה
- להורדה
- כפילויות
- e
- כל אחד
- קל
- אדג '
- השפעה
- יעיל
- יעילות
- הנדסת חשמל
- הטבעה
- מתעורר
- דגש
- מעסיקה
- מעצים
- כמוס
- לעודד
- סוף
- מהנדס
- הנדסה
- מהנדסים
- זן
- סביבה
- שוויון
- חיוני
- נוסד
- Ether (ETH)
- הערכה
- מַטִיף
- בדיוק
- דוגמה
- קיימים
- יצוא
- למדי
- משפחה
- מעריצים
- מָשׁוֹב
- מעטים
- פיקציה
- שדה
- שדות
- שלח
- קבצים
- לסנן
- סינון
- סופי
- ראשון
- מתאים
- גמיש
- להתמקד
- מרוכז
- מתמקד
- הבא
- בעד
- טופס
- פוּרמָט
- למרבה המזל
- נוסד
- ארבע
- חופשי
- החל מ-
- לגמרי
- פונקציונלי
- משחקים
- מטרה כללית
- ליצור
- נוצר
- לקבל
- GitHub
- לתת
- נתן
- מטרה
- גולף
- טוב
- יותר
- רֶשֶׁת
- קרקע
- קְבוּצָה
- מדריך
- שמח
- יש
- he
- ראש
- גובה
- לעזור
- עזר
- מועיל
- עוזר
- כאן
- באיכות גבוהה
- רזולוציה גבוהה
- הגבוה ביותר
- מאוד
- טיולים
- שֶׁלוֹ
- מחזיק
- איך
- איך
- אולם
- HTML
- http
- HTTPS
- בן אנוש
- i
- IAM
- ID
- לזהות
- זיהוי
- מזהה
- if
- תמונה
- תמונות
- פְּגִיעָה
- לייבא
- שיפור
- in
- באחר
- כולל
- לא נכון
- דגירה
- מידע
- בתחילה
- בהתחלה
- להתקין
- התקנה
- למשל
- במקום
- הוראות
- מוֹדִיעִין
- הִצטַלְבוּת
- אל תוך
- IT
- שֶׁלָה
- ג'רזי
- עבודה
- הצטרפות
- משותף
- ג'סון
- רק
- שמור
- שמירה
- תווית
- תיוג
- תוויות
- שפה
- בקנה מידה גדול
- לשגר
- השקה
- עוֹפֶרֶת
- מוביל
- לִלמוֹד
- למידה
- הכי פחות
- הוביל
- עזבו
- מאפשר לי
- סִפְרִיָה
- החיים
- כמו
- סביר
- להגביל
- מוגבל
- קו
- קווים
- רשימה
- רישום
- רישומים
- קְצָת
- חי
- לִטעוֹן
- נראה
- הסתכלות
- מגרש
- נמוך
- מכונה
- למידת מכונה
- עשוי
- קסם
- לעשות
- עושה
- לנהל
- הצליח
- ניהול
- מנהל
- רב
- מַפָּה
- שוק
- שיווק
- להתאים
- תואם
- מבחינה חומרית
- דבר
- מאי..
- מֵכָנִי
- מדיה
- פגישות
- meta
- מידע נוסף
- שיטה
- שיטות
- מישיגן
- מיקרוסופט
- צוותי
- יכול
- מינימום
- ML
- סלולרי
- אפליקציה לנייד
- מודל
- מודלים
- מודולים
- יותר
- רוב
- המהלך
- הרבה
- מספר
- מוזיקאים
- צריך
- שם
- שם
- שמות
- טבעי
- שפה טבעית
- טבע
- ליד
- בהכרח
- הכרחי
- צורך
- צרכי
- חדש
- באופן ניכר
- רעיון
- עַכשָׁיו
- ניואנס
- מספר
- אובייקט
- זיהוי אובייקט
- אובייקטים
- of
- רשמי
- on
- פעם
- ONE
- באינטרנט
- רק
- לפתוח
- קוד פתוח
- תפעול
- הזדמנות
- אפשרויות
- or
- מאורגן
- מְקוֹרִי
- OS
- אחר
- אחרים
- שלנו
- הַחוּצָה
- המתואר
- תפוקה
- יותר
- שֶׁלוֹ
- בעלים של
- חבילות
- מְזוּוָג
- חלק
- מסוים
- עבר
- נתיב
- תבנית
- דפוסי
- ביצועים
- אדם
- אישית
- שלבים של חומר
- גופני
- לבחור
- תמונות
- אָרִיג מְשׁוּבַּץ
- מישור
- פלטפורמות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- משחק
- נקודה
- מְאוּכלָס
- אפשרי
- הודעה
- כּוֹחַ
- תרגול
- חזה
- נבואה
- התחזיות
- תצוגה מקדימה
- קודם
- קוֹדֶם
- קופונים להדפסה
- קודם
- פְּרָטִי
- כנראה
- בעיות
- תהליך
- המוצר
- ניהול מוצר
- מנהל מוצר
- מוצרים
- פרופסור
- פּרוֹיֶקט
- רכוש
- לְעַתִיד
- אב טיפוס
- לספק
- ובלבד
- מתן
- ציבורי
- פונץ'
- למטרות
- פיתון
- קוונטית
- שאלות
- מהירות
- רכס
- במקום
- קריאה
- מוכן
- להמליץ
- המלצות
- להפחית
- מופחת
- הפחתה
- יחסית
- שוחרר
- רלוונטי
- להסיר
- נציג
- המייצג
- נדרש
- מחקר
- חוקרים
- החלטה
- לְהַגבִּיל
- תוצאה
- וכתוצאה מכך
- תוצאות
- קמעוני
- לַחֲזוֹר
- סקירה
- להיפטר
- רובוטיקה
- חָסוֹן
- תפקיד
- בערך
- שׁוּרָה
- להרוס
- ריצה
- בעל חכמים
- אמר
- כוח מכירות
- אותו
- סמסונג
- שמור
- סצנות
- מדע
- מדע בדיוני
- מדענים
- ציון
- בצורה חלקה
- שְׁנִיָה
- סעיף
- סעיפים
- לִרְאוֹת
- נראה
- נראה
- נבחר
- תחושה
- נפרד
- שרות
- שירותים
- מושב
- סט
- שיתוף
- היא
- צריך
- לְהַצִיג
- הופעות
- כן
- דומה
- פָּשׁוּט
- קטן יותר
- So
- תוכנה
- פיתוח תוכנה
- לפתור
- כמה
- מישהו
- משהו
- מֶרחָב
- לבלות
- הוצאה
- לפצל
- פיצולים
- סטנפורד
- התחלה
- החל
- החל
- סטארט - אפ
- מאיץ הפעלה
- מדינה-of-the-art
- צעדים
- עוד
- אחסון
- חנות
- אִסטרָטֶגִיָה
- סגנון
- סגנונות
- סיכום
- נתמך
- מערכות
- לקחת
- המשימות
- צוותי
- טכני
- TechStars
- אומר
- תבניות
- מבחן
- מֵאֲשֶׁר
- זֶה
- אל האני
- שֶׁלָהֶם
- אותם
- אז
- תיאורטי
- שם.
- אלה
- הֵם
- דברים
- לחשוב
- צד שלישי
- זֶה
- אלפים
- סף
- דרך
- זורק
- זמן
- ל
- יַחַד
- כלי
- ארגז כלים
- חלק עליון
- הרמה העליונה
- עליוניות
- סה"כ
- נגע
- לעקוב
- רכבת
- מְאוּמָן
- הדרכה
- לשנות
- שקיפות
- נָכוֹן
- אמת
- תור
- שתיים
- סוג
- סוגים
- תחת
- להבין
- ייחודי
- אוניברסיטה
- אוניברסיטת מישיגן
- עדכון
- us
- להשתמש
- במקרה להשתמש
- מְשׁוּמָשׁ
- משתמש
- משתמשים
- באמצעות
- ערכים
- מגוון
- שונים
- ספקים
- לאמת
- מאוד
- באמצעות
- לצפיה
- וירטואלי
- חזון
- רוצה
- היה
- we
- אינטרנט
- שירותי אינטרנט
- טוֹב
- היו
- מה
- מתי
- אם
- אשר
- ויקיפדיה
- יצטרך
- עם
- בתוך
- לְלֹא
- נשים
- מילים
- תיק עבודות
- עבד
- עובדים
- כוח עבודה
- עובד
- של העולם
- לדאוג
- היה
- לכתוב
- X
- אתה
- זפירנט
- רוכסן
- גן חיות