डेटा विश्लेषण की कला पर चार परिप्रेक्ष्य - डेटा विविधता

डेटा विश्लेषण की कला पर चार परिप्रेक्ष्य - डेटा विविधता

स्रोत नोड: 3059543

डेटा विज्ञान पेशेवरों के रूप में, हमें अक्सर ऐसे लोगों के रूप में देखा जाता है जो केवल डेटा के आधार पर निष्कर्ष निकालते हैं और अन्य कारकों को कम करते हैं। यह धारणा आम तौर पर तब विवादास्पद हो जाती है जब डेटा से प्राप्त अंतर्दृष्टि और साक्ष्य किसी और की "परिकल्पना" के साथ असंगत होते हैं। या जब "गुणात्मक" विश्लेषण मात्रात्मक विश्लेषण पर हावी हो जाता है तो हम भ्रमित और शायद निराश हो जाते हैं। अगली बार जब आप इस निराशा को महसूस करें, तो पुष्टि करने के लिए डेटा एनालिटिक्स पर इन चार दृष्टिकोणों पर विचार करें और अन्य विचारों पर विचार करें ताकि आप सामान्य आधार ढूंढने का प्रयास कर सकें:  

1. "बाहरी लोगों को समान अवसर।"  

आउटलेर्स स्वयं को डेटासेट में विसंगतियों के रूप में प्रस्तुत करते हैं। हो सकता है कि आउटलेयर शोर हों, लेकिन हो सकता है कि वे विशेष हों। 

आउटलेर्स अद्वितीय अंतर्दृष्टि, उभरते रुझान या दिलचस्प खंड हो सकते हैं। चिकित्सा अनुसंधान में, एक बाहरी बात किसी दवा के दुर्लभ लेकिन जीवन-घातक दुष्प्रभाव की ओर इशारा कर सकती है। ग्राहक डेटा के मामले में, एक बाहरी मूल्यवान ग्राहक क्षेत्र हो सकता है जिसे अभी तक संबोधित नहीं किया गया है। आउटलेयर एक उभरती हुई प्रवृत्ति हो सकती है। गुलाबी रंग की शुरुआत एक बाहरी रूप से हुई लेकिन जल्द ही यह सबसे लोकप्रिय फैशन विकल्प बन गया। 

आउटलेर्स को शोर के रूप में खारिज करने से पहले, उनका उपयोग प्रश्न और जिज्ञासा जगाने के लिए करें:   

  • क्या बाहरी पहलू किसी अवसर की ओर इशारा करता है?   
  • बाह्य का अस्तित्व क्यों है?   
  • यदि आप अपने डेटा सेट का टाइमस्टैम्प बदल सकते हैं, तो यह आउटलेर्स को कैसे प्रभावित कर सकता है? 
  • यदि अधिक आउटलेयर हैं तो क्या आपको यह मानना ​​होगा?  
  • विश्लेषण की जा रही प्रणाली या प्रक्रिया के बारे में एक बाहरी हमें क्या बताता है?    
  • किसी बाह्य को एक विशिष्ट प्रोफ़ाइल या खंड बनने में क्या लगेगा?  

आउटलेर्स को समझने से नवीन उत्पाद विकास हो सकता है, नए बाजार अवसरों की पहचान हो सकती है और संभावित जोखिमों की पहचान हो सकती है। पर्यावरण विज्ञान या अर्थशास्त्र जैसे क्षेत्रों में, आउटलेर्स महत्वपूर्ण पैटर्न परिवर्तनों का संकेत दे सकते हैं, जैसे अचानक जलवायु परिवर्तन या वित्तीय संकट। आउटलेर्स में हमारे डेटा को देखने और व्याख्या करने के तरीके को बदलने की क्षमता है, जो उन्हें गलत समझे गए डेटा बिंदुओं से जानकारी के मूल्यवान रत्नों में बदल देता है। 

2. “एक बार घटना घटती है। दो बार एक संयोग है. तीन बार करोगे तो एनीमी एक्शन होगी।" -गोल्ड फ़िन्गर  

कभी सोचा है कि दूसरे लोग इसे बनाने में सहज क्यों होते हैं"डेटा पर ही आधारितबहुत सीमित जानकारी के साथ निर्णय? अधिक डेटा बिंदु हमें अधिक आत्मविश्वास और उच्च सटीकता प्रदान करते हैं, लेकिन कभी-कभी, हमें शीघ्रता से कार्य करने की आवश्यकता होती है।  

हाल ही में, OpenAI ने अपनी खामियों के बावजूद ChatGPT लॉन्च किया, जबकि अन्य जिनके पास समान उत्पाद थे, वे प्रतिक्रियाओं की सटीकता में अपने आत्मविश्वास के स्तर को बढ़ाने के लिए इंतजार कर रहे थे। जब आप सोचते हैं कि कोई व्यक्ति कम आत्मविश्वास के स्तर और सीमित सटीकता के साथ डेटा-आधारित निर्णय ले रहा है, तो समय की लागत पर विचार करें। हो सकता है कि दुश्मन गोलीबारी कर रहा हो. 

3. "हर चीज़ जो मायने रखती है उसे गिना नहीं जा सकता, और हर चीज़ जिसे गिना जा सकता है वह मायने नहीं रखती।" -आमतौर पर इसका श्रेय अल्बर्ट आइंस्टीन को दिया जाता है 

दूसरे शब्दों में, “मैं आपके डेटा विश्लेषण की सराहना करता हूं, लेकिन मैं जो सोचता या सुनता हूं वह अधिक महत्वपूर्ण है। इसे गिना या मापा नहीं जा सकता।” 

आप कैसे प्रतिक्रिया देते हैं? यह स्थिति वह है जहां आपको रचनात्मक होने की आवश्यकता है।   

उदाहरण के लिए, ग्राहक भावना, ब्रांड निष्ठा और सांस्कृतिक बदलावों से प्रेरित रुझान सहित ग्राहक व्यवहार अमूर्त और मापने में कठिन हो सकता है। यदि आपके पास केवल ऑनलाइन व्यवहार डेटा है, तो नए डेटा स्रोतों जैसे परीक्षण कार्यक्रम, सर्वेक्षण, सामाजिक भावना विश्लेषण, ऑनलाइन नृवंशविज्ञान, या बैक-टू-द-बेसिक्स प्राथमिक ग्राहक अनुसंधान तक पहुंचने के लिए अन्य तरीकों का उपयोग करें।  

शायद कुछ भी निश्चित नहीं होगा, लेकिन यह विभिन्न तरीकों और स्रोतों का संयोजन और स्थिरता है जो एक सुसंगत निष्कर्ष की ओर इशारा करता है।  

4. "सहसंबंध कार्य-कारण के बराबर है?"  

कार्य-कारण के स्थान पर सहसंबंध का प्रयोग जागरूकता के बिना किए जाने पर गलत निर्णय लेने की ओर ले जा सकता है। हालाँकि, ऐसी स्थितियाँ हैं जहाँ हमारे पास केवल सहसंबंध डेटा तक पहुंच है। इन मामलों में, यह जांचना महत्वपूर्ण है कि क्या सहसंबंध महज संयोग है या कोई वैध अंतर्निहित कारण है। 

उदाहरण के लिए, विपणन व्यय एट्रिब्यूशन को मापने और बिक्री गतिविधियों का विश्लेषण करने की चुनौती पर विचार करें। ये जटिल कार्य हैं जिनका कोई सीधा कारण संबंध नहीं है। जब ग्राहक किसी ग्राहक ब्रीफिंग के लिए विक्रेता के कार्यालय में जाते हैं तो 90% समापन दर देखी जा सकती है, लेकिन यह महत्वपूर्ण है कि निष्कर्ष पर न पहुंचें और कार्य-कारण न मानें। इसके बजाय, अधिक सूक्ष्म दृष्टिकोण की आवश्यकता है।  

बारीकी से जांच करने पर, यह स्पष्ट हो जाता है कि उच्च समापन दर केवल प्रत्येक बिक्री इंटरैक्शन के लिए ग्राहक ब्रीफिंग शेड्यूल करने का परिणाम नहीं है। इसके बजाय, बातचीत स्वयं ग्राहकों में इन ब्रीफिंग में भाग लेने की इच्छा पैदा करती है, जो बाद में उच्च समापन दर की ओर ले जाती है। यह उदाहरण कला और विज्ञान के संलयन को दर्शाता है विश्लेषिकी - एक ऐसी प्रक्रिया जिसमें अंतर्निहित गतिशीलता को समझना शामिल है न कि केवल सतही सहसंबंधों पर निर्भर रहना। 

हम सभी आदर्श डेटासेट के साथ ढेर सारे डेटा का सांख्यिकीय विश्वास चाहेंगे। वास्तविकता यह है कि कभी-कभी, हमें रचनात्मक और कल्पनाशील होना चाहिए और आउटलेर्स, सहसंबंधों और वैकल्पिक डेटासेट की जांच करनी चाहिए। या कभी-कभी, समय नहीं होता है, और आपको सीमित डेटा पर कार्य करने की आवश्यकता होती है। 

समय टिकट:

से अधिक डेटावर्सिटी

सटीक डेमो: निर्णय आत्मविश्वास - डेटा में विश्वास को बेहतर बनाने के लिए डेटा गुणवत्ता के लिए आधुनिक दृष्टिकोण का उपयोग करना - डेटावर्सिटी

स्रोत नोड: 2836277
समय टिकट: अगस्त 21, 2023