כיצד לבנות תיק מדעי נתונים חזק כמתחיל
לאחר לימוד היסודות של מדעי הנתונים, אתה יכול להתחיל לעבוד על בעיות בעולם האמיתי. אבל איך אתה מציג את העבודה שלך? במאמר זה, אנו הולכים ללמוד דרך ייחודית ליצור תיק מדעי נתונים.
By עביד עלי אוואן, מדען נתונים מוסמך.
תמונה מאת מחבר | אלמנטים מאת וקטור חינם | איור מושג סטטיסטיקה
בתור מתחיל, היו לי שאלות רבות לגבי איך אני מתחיל? איך אני לומד, או מאיפה אני מקבל רעיונות לעבוד על פרויקטים. אז, לאחר חיפוש ארוך, מצאתי פרויקט על ניתוח נתונים. לקח לי 3 ימים רק לכתוב קוד, והייתי מרוצה מהניסיון הראשון שלי, אבל אז הייתה שאלה גדולה איך אני חולק את זה עם העולם? פשוט לא היו לי כישורי קידוד או כישורי תיעוד טובים כדי להציג את העבודה שלי, אז אחסנתי אותה בענן ושכחתי מזה. אחרי חודש, חיפשתי באקראי פרויקטים נוספים ב-GitHub ומצאתי את זה מדהים פרופיל שהניע אותי ליצור את תיק העבודות שלי. זו הייתה ההחלטה הטובה ביותר שעשיתי מכיוון שהיא העלתה אותי על המפה של קהילת המפתחים, וזמן קצר לאחר מכן התחלתי לקבל מיילים מהמגייסים ומהמתחילים על הפרויקטים שלי.
להשיג עבודה היא בדרך כלל הסיבה העיקרית לבניית תיק עבודות. לפעמים, זה הכרחי אם אין לנו את ההשכלה או הניסיון הרלוונטיים (eugeneyan.com). בעולם המודרני הזה, מעסיקים סקפטיים לגבי העסקת בוגרים חדשים, אז איך משכנעים אותם שאתה הכי מתאים לתפקיד? אתה מציג את כישוריך על ידי הצגת העבודה שעשית בפרויקט קודם. ככל שהפורטפוליו המקוון שלך חזק יותר, כך יש לך סיכוי גבוה יותר להתקבל לעבודת החלומות שלך.
"התיקים הם קריטיים ביותר כי כשאתה בראיון, זה מראה את החוויה שלך בעולם האמיתי, כך שאתה יכול להסביר למעסיק מא' עד ת' את כל זרימת העבודה של מדעי הנתונים." — דיוויד יעקובוביץ '.
המוטיבציה האחרת היא ליצור את שלך פרויקט אישי שמספק את הסקרנות שלך לגבי לימוד דברים חדשים. כאשר אנו לומדים מיומנות חדשה, אנו רוצים להתנסות ובסופו של דבר לבנות מוצר עובד שניתן להשתמש בו בעולם האמיתי.
במאמר זה, נלמד את הדרכים בהן תוכל להציג את עבודתך כמתחיל במדעי הנתונים. תלמדו על איזו פלטפורמה חדשה שהופכת את החיים שלכם לקלים וטיפים לבניית תיקים חזקים.
GitHub
הרשו לי רק לנקות את התפיסה המוטעית בקרב מדעני נתונים. כן, GitHub הכרחי, וכולנו צריכים ללמוד סילון. כמדען נתונים, אני משתמש ב-Github מדי יום, שם אני מחפש מערכי נתונים ופרויקטים מעניינים. זוהי הפלטפורמה הפופולרית ביותר בקרב מפתחים, ולמען האמת, המגייס אכן בודק את פרופיל ה-GitHub שלך לפני שמתקשר אליך לראיון.
תמונה מאת מחבר | GitHub
GitHub היא פלטפורמת שיתופיות גלובלית שבה אנשים משתפים ומשתפים פעולה בפרויקטים. כפי שאתה יכול לראות בפרופיל שלי למטה איך תרמתי לפרויקטים של אנשים אחרים וגם עבדתי על הפרויקטים שלי.
תמונה מאת המחבר | kingabzpro
טיפים ליצירת פרופיל מוצק:
- צור את דף הפרופיל שלך, ותראה הדרכה מלאה של שרה הארט בלוג.
- תעד כל פרויקט עם קישורים, תמונות שער ותיאורים מפורטים.
- קח את הפרויקט שאתה הכי אוהב ושלח את בקשת המשיכה הראשונה שלך (freecodecamp.org).
- היה פעיל בפלטפורמה זו על ידי תרומה, דיווח על באגים ודחיפת הפרויקטים הנוכחיים שלך.
הערה עמוקה
הערה עמוקה הוא הרבה יותר פשוט מ-GitHub, והוא גם ידידותי למתחילים. אם אתה מכיר מחברת צדק אז זה יהיה חתיכת עוגה עבורך לפרסם את הפרויקט הראשון שלך. הניסיון שלי עם Deepnote מדהים לחלוטין שכן הפלטפורמה מספקת לך את כל האיכויות של GitHub אך היא הרבה יותר פשוטה וממוקדת בקהילת מדעני הנתונים.
תמונה מאת המחבר | התקדמות החיסון בפקיסטן
לאחרונה, הם הציגו פרופיל Deepnote שיציג את כל המחברות שאתה מפרסם עם המידע ותמונת הפרופיל שלך.
תמונה מאת המחבר | הערה עמוקה
בדיוק כמו גיסט GitHub, אתה יכול לשתף קטע מהקוד שלך עם הצוות שלך או עם הציבור בכלל. השתמשתי ב-Deepnote cell בכל הפלטפורמות של Medium Publication ומדיה חברתית. אתה יכול לבדוק את הקודם שלי מאמר כדי להבין כיצד ליישם תא Deepnote. שימוש בקטעי קוד עם פלט נותן לך את היכולת לשתף את הפרויקטים שלך במספר פלטפורמות.
הסיבה שאני מעדיף תא משובץ Deepnote על פני GitHub Gist היא שהוא מגיע עם פלט, לא רק פלט סטטי אלא עם תכונות אינטראקטיביות.
אתה יכול להשתמש ב-Plotly ולהציג את התרשים שלך במאמר בינוני:
טיפים ליצירת פרופיל מוצק:
- עדכן את הביוגרפיה, תמונת הפרופיל ופרטי הקשר שלך.
- הוסף תמיד תיאורים מפורטים על הפרויקט שלך באמצעות תא סימון.
- השתמש בתמונת השער כדי להבליט את הפרויקט שלך.
- השתמש בתכונות האפליקציה ב-Deepnote כדי ליצור אפליקציית אינטרנט אינטראקטיבית.
- המשך לפרסם את הפרויקט הישן שלך או אפילו לפרסם מחדש מחברות מ-GitHub.
DAGsHub
DAGsHub הוא חדש בעולם הזה, והוא עושה את שמו במהירות על ידי מתן פתרון נקודתי עבור מתרגלים למידת מכונה ומהנדסי נתונים. DAGsHub מגיע עם א DVC שרת, זרימת ML, הדמיית צינור וסנכרון GitHub. לא ניכנס לעומק המאפיינים אלא נתמקד במאפיינים שמבליטים אותו.
DAGsHub מאפשר לך לשתף את מאגר GitHub שלך וליצור את פרויקט מדעי הנתונים שלך עם היכולת לדמיין למידת מכונה וצינורות נתונים. יש לו גם תכונה נסתרת README.ipynb כקובץ תיאור הפרויקט שלך, שהוא הטוב ביותר למתחילים שאינם רגילים לסימון ולמדעני נתונים שאוהבים לעבוד על Jupyter Notebook. זה דומה ל-GitHub, מה שאומר שאתה צריך ללמוד גם Git וגם DVC כדי להשתמש בפלטפורמה הזו כראוי.
מה שראיתי שמשתמשים אחרים נהנים הוא היכולת לדמיין את מבנה הפרויקט שלהם דרך הצינור, כמו גם היכולת לראות את הנתונים והמודלים שלהם כחלק בלתי נפרד מהפרויקט. כמו כן, העובדה שאנו מבוססים על כלים בקוד פתוח במקום להמציא מחדש פתרונות קיימים היא משהו שאנשים אוהבים. — דֵיקָן
תמונה מאת דין | dagshub
הפרופיל שלי די חדש, אבל אני אוהב את הפלטפורמה הזו מכיוון שהם מספקים לי מערכת אקולוגית שלמה למידת מכונה. אני חושב שאני מעדיף את זה יותר מאשר GitHub מבחינת תכונות ופשטות ממשק משתמש.
תמונה מאת המחבר | DAGsHub
טיפים ליצירת פרופיל מוצק:
- ללמוד DVC, Git, ו זרימת ML לנצל את מלוא היתרונות.
- הוסף תיאור פרויקט למחברת שלך ו-README.
- עדכן את הפרופיל שלך על ידי הוספת ביוגרפיה, אווטאר ופרטי איש קשר.
- נסו להוסיף dvc.yaml ו dvc.lock בפרויקט שלך כדי להציג צינורות נתונים. למידע נוסף, בדוק הגדרת הצינור.
- שמור על פרופיל פעיל על ידי תרומה לפרויקטים בקוד פתוח ועל ידי דחיפה של הפרויקט האישי שלך. אתה יכול להשתמש FDS cli כדי להפוך את חייך לקלים ולהימנע מטעויות.
- עושה שימוש מלא ב-DVC על ידי העלאת הנתונים והדגם שלך בשרת מרוחק. מגייסים מעוניינים במועמדים שמכירים את מחזור מדעי הנתונים המלא, החל מהטמעת נתונים ועד לוחות מחוונים.
קגל
אם אתה רוצה להבחין מהר יותר בעולם מדעי הנתונים, עליך ליצור א קגל חשבון ולהתחיל לתרום לתחרויות, מערכי נתונים, מחברות ודיונים. כשאתה הופך לרב-מאסטר, אנשים מכבדים אותך ומציעים לך הזדמנויות קריירה טובות יותר. אם אתה שואל אותי, אני מציע לך ליצור פרופיל Kaggle תוך כדי לימוד היסודות. למד ממומחים וגלה את הנישה שלך. אני מעריץ ענק של הפלטפורמה הזו מכיוון שהיא מספקת תמיכה למתחילים להתחרות ולפתח פתרונות חדשניים לתעשיות שונות. זהו עמוד השדרה של מחקר בינה מלאכותית.
תמונה מאת המחבר | קגל
אתה יכול לבדוק את הפרופיל שלי למטה, מאז ההתחלה, אני תורם בקטגוריות שונות כדי לצבור דרגות. נכון לעכשיו, אני מומחה, אבל עם מדליית זהב וכסף אחת בתחרות, אהפוך למאסטר, וזה לא קל, ולמען האמת, אני מכבד גראנדמאסטרים מכיוון שהם הוכיחו שהם הטובים ביותר מבין מתרגלי נתונים אחרים.
תמונה מאת המחבר | קגל
טיפים ליצירת פרופיל מוצק:
- היה פעיל בפלטפורמה על ידי שימוש במערכי נתונים חדשים ויצירת מודלים של ניתוח נתונים או למידת מכונה.
- השתתף בדיון, למד ממומחים ובקש עזרה.
- השתמש בגרידת אינטרנט כדי לפרסם מערך נתונים חדש.
- השתתף ברוב התחרויות כדי ללמוד כמה סוגים של בעיות למידת מכונה ולהרוויח תגים.
- התמקד בפרסום העבודה הטובה ביותר שלך עם תיאורים מפורטים וקוד באיכות גבוהה.
- כתבו על עצמכם בביו והוסיפו פרטים ליצירת קשר.
בלוג
כתיבת בלוגים היא השלב הבא לאחר יצירת הפרויקט שלך בפלטפורמות שלעיל. אם אתה רוצה להרחיב את הקהל שלך, אני מאוד ממליץ לך להתחיל עם בינוני. כתיבת בלוג אינה הכרחית, אבל אתה מקבל יותר משיכה מתחומים שונים. הפלטפורמה Medium מאפשרת לך ליצור את הפרופיל שלך ולאפשר לך לפרסם את המאמרים שלך תחת פרסומים שונים כגון לקראת מדעי נתונים ו לקראת AI. אתה יכול לפתח את אתר הבלוגים שלך או להשתמש בפלטפורמה דומה אחרת כגון אנליטיקה וידיה.
תמונה מאת המחבר | בינוני
טיפים ליצירת פרופיל מוצק:
- כתוב בלוגים על הפרויקט שעבדת עליו באופן אישי.
- צור בלוגים על טכנולוגיה מתפתחת או על יישומי מדעי נתונים חדשים.
- בצע מחקר נכון בזמן כתיבת בלוגים והוסף ציטוטים כדי להימנע מהפרות של חוקי הפלטפורמה.
- השתמש בתמונות שער אטרקטיביות לכל בלוג.
- כתוב תמיד על מה שאתה לומד מניסיונך בעת פיתוח פרויקטים בתחום מדעי הנתונים.
- אל תעקבו אחר המגמה, והתמקדו בדברים שאתם טובים בהם.
אתר פורטפוליו
אתה יכול גם להציג את הפרויקט שלך באתר אישי, ואם אתה לא מפתח אתרים, יש כמה כלים פשוטים זמינים כדי להקל על התהליך. אתה יכול לבדוק כיצד לבנות אתר פורטפוליו של מדעי הנתונים עם דפי הוגו ו-GitHub ו הוגו עבור תבניות שונות.
באתר הפורטפוליו שלי יש פרויקט מכל הפלטפורמות עם תיאורים קצרים ותתי קטגוריות. לקח לי שלושה ימים ליצור את האתר כולו ולפרוס אותו בדפי GitHub.
תמונה מאת המחבר | תיק עבודות
טיפים ליצירת אתר פורטפוליו מוצק:
- הוסף את המיומנות, הביוגרפיה והקורות חיים שלך.
- הצג את הניסיון שלך וא
- הצג את הפרויקטים שלך עם קישורים לפרויקטי GitHub או Deepnote שלך.
- הפוך את האתר שלך למינימלי ואינטראקטיבי כך שלמגייס יהיה קל לגלול בכל תיק העבודות שלך.
- שמור את אתר הפורטפוליו שלך מעודכן בפרויקט האחרון שאתה עובד עליו.
משקל והטיות
אני בדרך כלל להשתמש משקל והטיות עבור ניסויים של למידת מכונה ומדדי ביצועי רישום של הדגמים שלי, אבל זה השתנה עם הצגת פרופיל W&B. אתה יכול לכתוב בלוג על הפרויקט הנוכחי שלך באמצעות קישורים מוטמעים ושילוב גרפים. זה די דומה לפלטפורמות תיקים אחרות שהזכרתי, אבל זה מגיע עם היתרון של אינטגרציה ישירה עם ספריות Python.
השמיים איוש הפרופיל הרשים אותי ביותר שכן הוא תרם לארגונים אחרים בזמן כתיבת בלוגים על למידת מכונה.
תמונה מאת Ayush | משקולות והטיות
לפרויקט W&B יש מדדי ביצועים של מודל, כפי שמוצג להלן.
תמונה מאת המחבר | kaggle-seti
טיפים ליצירת פרופיל מוצק:
- הצטרף לארגונים אחרים בתחום מדעי הנתונים והשתתף בפרויקטים קבוצתיים.
- השתמש ב-W&B API כדי להציג את תוצאות פרויקט למידת המכונה שלך.
- כתוב בלוג באמצעות אינטגרציה של מדדי W&B.
- הוסף ביוגרפיה, תמונת פרופיל, פרטי קשר.
- נסו להשתתף בדיון קהילתי ותמיד חפשו פרויקט מעניין חדש.
סיכום
W&B הוא תו כללי מכיוון שהוא מפורסם בשל ניסויי רישום ולא בתיקי תיקים, אך הצגת הבלוגים האינטראקטיביים העניקה לנו את היתרון הייחודי של הצגת הפרויקט שלך ויצירת תיק עבודות חזק.
אם אתה מתחיל, אציע לך להתחיל עם Deepnote, מכיוון שהוא בחינם לצוותים ולתת את הכלים הידידותיים למתחילים שלך להתחיל. אם אתה מחפש לשים לב לקהילת מדעי הנתונים, נסה ליצור את הפרופיל שלך ב-GitHub וב-Kaggle. אם אתה בעניין של יצירת המותג שלך, התחל עם אתרי בלוגים או צור את האתר שלך.
בסופו של דבר, אני רוצה שכולכם תצרו את הפרופיל שלכם בכל הפלטפורמות שציינתי לעיל, שכן לכולן יש יתרונות ייחודיים להרשים את המעסיק הפוטנציאלי שלכם. אני יודע שזה די מכריע בהתחלה, אבל ברגע שתתרגל לתעד ולהציג את הפרויקטים שלך, זה יהיה קל.
Bio you עביד עלי אוואן (@1abidaliawan) הוא איש מקצוע מוסמך של מדען נתונים שאוהב לבנות מודלים של למידת מכונה ולחקור את טכנולוגיות הבינה המלאכותית העדכניות ביותר. כעת בודקים מוצרי בינה מלאכותית ב-PEC-PITC, עבודתם מאושרת מאוחר יותר לניסויים בבני אדם, כגון סיווג סרטן השד.
מידע נוסף:
הסיפורים הגדולים ביותר ב 30 יום | |||||
---|---|---|---|---|---|
|
|
מקור: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- חֶשְׁבּוֹן
- פעיל
- יתרון
- AI
- ai מחקר
- תעשיות
- בין
- אנליזה
- API
- האפליקציה
- יישומים
- אפליקציות
- מאמר
- מאמרים
- קהל מאזינים
- גִלגוּל
- תגים
- יסודות
- הטוב ביותר
- בלוג
- בלוגים
- בלוגים
- סרטן השד
- חרק
- לִבנוֹת
- בִּניָן
- מחלת הסרטן
- קריירה
- ענן
- קוד
- סִמוּל
- שיתוף פעולה
- קהילה
- תחרות
- תחרויות
- תרם
- יוצרים
- סקרנות
- נוֹכְחִי
- נתונים
- ניתוח נתונים
- מדע נתונים
- מדען נתונים
- למידה עמוקה
- לפתח
- מפתח
- מפתחים
- DID
- המערכת האקולוגית
- חינוך
- מעסיקים
- הנדסה
- מהנדסים
- Excel
- לְהַרְחִיב
- ניסיון
- לְנַסוֹת
- מומחים
- פָּנִים
- מאפיין
- תכונות
- שדות
- ראשון
- להתמקד
- לעקוב
- חופשי
- מלא
- כללי
- Git
- GitHub
- גלוֹבָּלִי
- זהב
- טוב
- קְבוּצָה
- מדריך
- שכירה
- איך
- איך
- HTTPS
- עצום
- תעשיות
- מידע
- חדשני
- אינטגרלי
- השתלבות
- אינטראקטיבי
- ראיון אישי
- IT
- עבודה
- מחברת צדק
- האחרון
- לִלמוֹד
- למידה
- לינקדין
- ארוך
- אהבה
- למידת מכונה
- עשייה
- מַפָּה
- מדיה
- בינוני
- מדדים
- מודל
- הכי פופולארי
- פלטפורמה חדשה
- מחשבים ניידים
- הַצָעָה
- באינטרנט
- לפתוח
- הזדמנויות
- ארגונים
- אחר
- אֲנָשִׁים
- ביצועים
- תמונה
- פלטפורמה
- פלטפורמות
- פופולרי
- תיק עבודות
- המוצר
- מוצרים
- פּרוֹפִיל
- פּרוֹיֶקט
- פרויקטים
- ציבורי
- פרסומים
- לפרסם
- הוצאה לאור
- פיתון
- עולם אמיתי
- מחקר
- תוצאות
- כללי
- מדע
- מדענים
- גרידה
- חיפוש
- שיתוף
- קצר
- כסף
- פָּשׁוּט
- אתרים
- מיומנויות
- So
- חֶברָתִי
- מדיה חברתית
- פלטפורמות מדיה חברתיות
- פתרונות
- התחלה
- החל
- סטטיסטיקה
- סיפורים
- תמיכה
- טכנולוגיות
- טכנולוגיה
- בדיקות
- היסודות
- העולם
- זמן
- טיפים
- חלק עליון
- הדרכה
- ui
- us
- משתמשים
- אינטרנט
- גירוד באינטרנט
- אתר
- מי
- תיק עבודות
- זרימת עבודה
- עוֹלָם
- כתיבה
- X
- YouTube