ארבע נקודות מבט על אמנות ניתוח הנתונים - DATAVERSITY

ארבע נקודות מבט על אמנות ניתוח הנתונים - DATAVERSITY

צומת המקור: 3059543

כאנשי מקצוע בתחום מדעי הנתונים, אנו נתפסים לעתים קרובות כאנשים שמסיקים מסקנות רק על סמך נתונים ומצמצמים גורמים אחרים. תפיסה זו הופכת בדרך כלל למחלוקת כאשר התובנות והראיות מהנתונים אינן עולות בקנה אחד עם ה"השערה" של מישהו אחר. או שאנחנו מבולבלים ואולי מתוסכלים כאשר ניתוח "איכותי" גובר על ניתוח כמותי. בפעם הבאה שאתה מרגיש את התסכול הזה, שקול את ארבע נקודות המבט האלה על ניתוח נתונים כדי לאמת ולשקול דעות אחרות כדי שתוכל לנסות ולמצוא בסיס משותף:  

1. "חריגים שוות הזדמנויות."  

חריגים מציגים את עצמם במערך נתונים כחריגות. אולי חריגים הם רעש, אבל אולי הם מיוחדים. 

חריגים יכולים להיות תובנות ייחודיות, טרנדים מתפתחים או פלחים מעניינים. במחקר רפואי, חריג יכול להצביע על תופעת לוואי נדירה אך מסכנת חיים של תרופה. במקרה של נתוני לקוחות, חריג יכול להיות נישת לקוח רבת ערך שטרם טופלה. חריגות יכולות להיות מגמה מתפתחת. הצבע הוורוד התחיל בתור חריג אבל הפך במהירות לבחירה האופנתית הפופולרית ביותר. 

לפני שפוסלים חריגים כרעש, השתמש בהם כדי לעורר שאלות וסקרנות:   

  • האם החריג מצביע על הזדמנות?   
  • למה החריג קיים?   
  • אם תוכל לשנות את חותמת הזמן של מערך הנתונים שלך, איך זה יכול להשפיע על החריגים? 
  • האם תצטרך להניח אם יש יותר חריגים?  
  • מה אומר לנו חריג על המערכת או התהליך המנותח?    
  • מה יידרש כדי שחורג יהפוך לפרופיל או פלח מובחן?  

הבנת חריגים יכולה להוביל לפיתוח מוצר חדשני, זיהוי הזדמנויות שוק חדשות וזיהוי סיכונים פוטנציאליים. בתחומים כמו מדעי הסביבה או כלכלה, חריגים יכולים לסמן שינויים דפוסים חשובים, כמו שינויי אקלים פתאומיים או משברים פיננסיים. לחריגים יש פוטנציאל לשנות את האופן שבו אנו רואים ומפרשים נתונים, ולשנות אותם מנקודות נתונים לא מובנות לאבני חן יקרות של מידע. 

2. "פעם זה מקרה. פעמיים זה צירוף מקרים. שלוש פעמים זה פעולת אויב". -אצבע זהב  

אי פעם תהית למה לאחרים נוח להכין "נתונים מונחים"החלטות עם מידע מוגבל מאוד? יותר נקודות נתונים מעניקות לכולנו יותר ביטחון ודיוק גבוה יותר, אבל לפעמים, אנחנו צריכים לפעול במהירות.  

לאחרונה, OpenAI השיקה את ChatGPT למרות הפגמים שלה, בעוד שאחרים שהיו להם מוצרים דומים חיכו כדי להגביר את רמת הביטחון שלהם ברמת הדיוק של התגובות. כאשר אתה חושב שמישהו מקבל החלטה מונעת נתונים עם רמות ביטחון נמוכות ודיוק מוגבל, שקול את עלות הזמן. יכול להיות שהאויב יורה. 

3. "לא כל מה שנחשב אפשר לספור, ולא כל מה שאפשר לספור נחשב". -מיוחס בדרך כלל לאלברט איינשטיין 

במילים אחרות, "אני מעריך את ניתוח הנתונים שלך, אבל מה שאני חושב או שומע חשוב יותר. אי אפשר לספור או למדוד את זה". 

איך אתה מגיב? המצב הזה הוא המקום שבו אתה צריך להיות יצירתי.   

לדוגמה, התנהגות לקוחות, לרבות סנטימנט לקוחות, נאמנות למותג ומגמות המונעות על ידי שינויים תרבותיים, יכולה להיות בלתי מוחשית וקשה לכימות. אם יש לך רק נתוני התנהגות מקוונים, השתמש בשיטות אחרות כדי לגשת למקורות נתונים חדשים כגון תוכניות בדיקה, סקרים, ניתוח סנטימנטים חברתיים, אתנוגרפיה מקוונת או מחקר לקוחות ראשוני הבסיסי.  

אולי שום דבר לא יהיה סופי, אבל השילוב והעקביות של שיטות ומקורות שונים הם שמצביעים על מסקנה עקבית.  

4. "מתאם שווה סיבתיות?"  

החלפת מתאם בסיבתיות עלולה להוביל לקבלת החלטות מוטעות כאשר היא נעשית ללא מודעות. עם זאת, ישנם מצבים שבהם יש לנו גישה רק לנתוני מתאם. במקרים אלה, חיוני לבדוק אם המתאם הוא צירוף מקרים בלבד או אם יש סיבה בסיסית תקפה. 

לדוגמה, שקול את האתגר של מדידת ייחוס הוצאות שיווק וניתוח פעילויות מכירות. אלו משימות מורכבות ללא קשר סיבתי ישיר. אפשר לראות שיעור סגירה של 90% כאשר לקוחות מבקרים במשרד של ספק לצורך תדרוך לקוחות, אבל חשוב לא לקפוץ למסקנות ולהניח קשר סיבתי. במקום זאת, יש צורך בגישה ניואנסית יותר.  

בבדיקה מעמיקה יותר, מתברר ששיעור הסגירה הגבוה אינו תוצאה של תזמון תדריכי לקוחות עבור כל אינטראקציה של מכירה. במקום זאת, האינטראקציות עצמן יוצרות אצל הלקוחות את הרצון להשתתף בתדריכים אלו, מה שמוביל לאחר מכן לשיעור סגירה גבוה. דוגמה זו ממחישה את המיזוג של אמנות ומדע ב ניתוח – תהליך הכולל הבנת הדינמיקה הבסיסית ולא הסתמכות רק על מתאמים שטחיים. 

כולנו היינו רוצים את הביטחון הסטטיסטי של הרבה נתונים עם מערך הנתונים האידיאלי. המציאות היא שלפעמים, עלינו להיות יצירתיים ובעלי דמיון ולבחון חריגים, מתאמים ומערכי נתונים חלופיים. או לפעמים, אין זמן, ואתה צריך לפעול לפי נתונים מוגבלים. 

בול זמן:

עוד מ קושי