چهار دیدگاه در هنر تجزیه و تحلیل داده ها - DATAVERSITY

چهار دیدگاه در هنر تجزیه و تحلیل داده ها - DATAVERSITY

گره منبع: 3059543

به عنوان متخصصان علم داده، اغلب به عنوان افرادی در نظر گرفته می‌شویم که تنها بر اساس داده‌ها نتیجه می‌گیریم و سایر عوامل را به حداقل می‌رسانیم. این تصور معمولاً زمانی بحث برانگیز می شود که بینش ها و شواهد به دست آمده از داده ها با "فرضیه" شخص دیگری سازگار نباشد. یا وقتی تحلیل «کیفی» بر تحلیل کمی غلبه می‌کند، سردرگم و ممکن است ناامید شویم. دفعه بعد که این ناامیدی را احساس کردید، این چهار دیدگاه را در مورد تجزیه و تحلیل داده ها در نظر بگیرید تا دیدگاه های دیگر را تأیید کنید و در نظر بگیرید تا بتوانید زمینه های مشترک را پیدا کنید:  

1. "فرصت فرصت برابر."  

نقاط پرت خود را در یک مجموعه داده به عنوان ناهنجاری نشان می دهند. شاید نقاط پرت نویز باشند، اما شاید خاص باشند. 

نقاط پرت می توانند بینش های منحصر به فرد، روندهای نوظهور یا بخش های جالب باشند. در تحقیقات پزشکی، یک موضوع دور از دسترس می تواند به یک عارضه جانبی نادر اما تهدید کننده زندگی یک دارو اشاره کند. در مورد داده‌های مشتری، یک نقطه پرت می‌تواند یک جایگاه ارزشمند مشتری باشد که هنوز به آن پرداخته نشده است. نقاط پرت می تواند یک روند در حال ظهور باشد. رنگ صورتی به عنوان یک رنگ پرت شروع شد اما به سرعت به محبوب ترین انتخاب مد تبدیل شد. 

قبل از نادیده گرفتن موارد پرت به عنوان نویز، از آنها برای برانگیختن سوالات و کنجکاوی استفاده کنید:   

  • آیا نقطه دورتر به یک فرصت اشاره می کند؟   
  • چرا حالت پرت وجود دارد؟   
  • اگر بتوانید مهر زمانی مجموعه داده‌های خود را تغییر دهید، چگونه می‌تواند بر مقادیر پرت تأثیر بگذارد؟ 
  • آیا باید فرض کنید که مقادیر پرت بیشتری وجود دارد؟  
  • یک نقطه پرت در مورد سیستم یا فرآیند مورد تجزیه و تحلیل به ما چه می گوید؟    
  • چه چیزی لازم است تا یک پرت به یک نمایه یا بخش متمایز تبدیل شود؟  

درک عوامل پرت می تواند منجر به توسعه محصول نوآورانه، شناسایی فرصت های جدید بازار و شناخت ریسک های بالقوه شود. در زمینه هایی مانند علم محیط زیست یا اقتصاد، نقاط پرت می توانند تغییرات الگوی مهمی مانند تغییرات آب و هوایی ناگهانی یا بحران های مالی را نشان دهند. نقاط دورافتاده این پتانسیل را دارند که نحوه مشاهده و تفسیر داده‌ها را تغییر دهند، و آنها را از نقاط داده‌ای نادرست به اطلاعات ارزشمند تبدیل کنند. 

2. «یک بار اتفاقی است. دو بار تصادفی است. سه برابر اقدام دشمن است.» -انگشت طلا  

تا به حال فکر کرده اید که چرا دیگران راحت هستندداده محورتصمیمات با اطلاعات بسیار محدود؟ نقاط داده بیشتر به همه ما اعتماد به نفس و دقت بالاتری می دهد، اما گاهی اوقات لازم است سریع عمل کنیم.  

اخیراً، OpenAI ChatGPT را با وجود نقص‌هایش راه‌اندازی کرد، در حالی که دیگرانی که محصولات مشابهی داشتند منتظر بودند تا سطح اطمینان خود را در دقت پاسخ‌ها افزایش دهند. وقتی فکر می‌کنید کسی تصمیمی مبتنی بر داده‌ها با سطح اطمینان پایین و دقت محدود می‌گیرد، هزینه زمان را در نظر بگیرید. ممکن است دشمن شلیک کند. 

3. "هر چیزی که مهم است قابل شمارش نیست، و هر چیزی که قابل شمارش باشد قابل شمارش نیست." - معمولاً به آلبرت انیشتین نسبت داده می شود 

به عبارت دیگر، "من از تجزیه و تحلیل داده های شما قدردانی می کنم، اما آنچه فکر می کنم یا می شنوم مهم تر است. قابل شمارش یا اندازه گیری نیست.» 

چگونه پاسخ می دهید؟ این موقعیت جایی است که شما باید خلاق باشید.   

به عنوان مثال، رفتار مشتری، از جمله احساسات مشتری، وفاداری به برند، و روندهای ناشی از تغییرات فرهنگی، می تواند نامشهود باشد و تعیین کمیت آن دشوار است. اگر فقط داده‌های رفتار آنلاین دارید، از روش‌های دیگر برای دسترسی به منابع داده جدید مانند برنامه‌های آزمایشی، نظرسنجی‌ها، تجزیه و تحلیل احساسات اجتماعی، قوم‌نگاری آنلاین یا تحقیقات اولیه مشتری استفاده کنید.  

شاید هیچ چیز قطعی نباشد، اما ترکیب و سازگاری روش ها و منابع مختلف است که به یک نتیجه گیری ثابت اشاره می کند.  

4. "همبستگی برابر است با علیت؟"  

جایگزینی همبستگی به جای علیت می‌تواند منجر به تصمیم‌گیری نادرست در صورت انجام بدون آگاهی شود. با این حال، شرایطی وجود دارد که ما فقط به داده های همبستگی دسترسی داریم. در این موارد، بررسی دقیق اینکه آیا همبستگی صرفاً تصادفی است یا یک علت اساسی معتبر وجود دارد بسیار مهم است. 

به عنوان مثال، چالش اندازه گیری هزینه های بازاریابی و تجزیه و تحلیل فعالیت های فروش را در نظر بگیرید. اینها وظایف پیچیده ای هستند که هیچ پیوند علی مستقیمی ندارند. زمانی که مشتریان برای یک جلسه توجیهی مشتری به دفتر فروشنده مراجعه می کنند، ممکن است نرخ بسته شدن 90٪ مشاهده شود، اما مهم است که در نتیجه گیری عجله نکنید و علت را فرض نکنید. در عوض، یک رویکرد ظریف تر مورد نیاز است.  

با بررسی دقیق تر، آشکار می شود که نرخ بالای بسته شدن نتیجه صرفاً برنامه ریزی جلسات توجیهی مشتری برای هر تعامل فروش نیست. در عوض، خود این تعاملات تمایل به حضور در این جلسات توجیهی را در مشتریان ایجاد می کند که متعاقباً منجر به نرخ بالای بسته شدن می شود. این مثال ادغام هنر و علم را نشان می دهد علم تجزیه و تحلیل - فرآیندی که شامل درک پویایی های زیربنایی و نه تنها تکیه بر همبستگی های سطحی است. 

همه ما خواهان اطمینان آماری تعداد زیادی از داده ها با مجموعه داده ایده آل هستیم. واقعیت این است که گاهی اوقات، ما باید خلاق و تخیلی باشیم و موارد پرت، همبستگی ها و مجموعه داده های جایگزین را بررسی کنیم. یا گاهی اوقات، زمانی وجود ندارد، و باید بر اساس داده های محدود عمل کنید. 

تمبر زمان:

بیشتر از DATAVERSITY