Empat Perspektif Seni Analisis Data - DATAVERSITY

Empat Perspektif Seni Analisis Data – DATAVERSITY

Node Sumber: 3059543

Sebagai profesional data science, kita sering dipandang sebagai orang yang menarik kesimpulan hanya berdasarkan data dan meminimalkan faktor lainnya. Persepsi ini biasanya menjadi perdebatan ketika wawasan dan bukti dari data tidak konsisten dengan “hipotesis” orang lain. Atau kita bingung dan mungkin frustrasi ketika analisis “kualitatif” mengalahkan analisis kuantitatif. Jika nanti Anda merasa frustrasi, pertimbangkan empat perspektif analisis data berikut untuk memvalidasi dan mempertimbangkan pandangan lain sehingga Anda dapat mencoba dan menemukan titik temu:  

1. “Outlier memiliki peluang yang sama.”  

Pencilan menampilkan dirinya dalam kumpulan data sebagai anomali. Mungkin outlier itu berisik, tapi mungkin itu spesial. 

Pencilan bisa berupa wawasan unik, tren yang sedang berkembang, atau segmen yang menarik. Dalam penelitian medis, pencilan dapat menunjukkan efek samping suatu obat yang jarang namun mengancam jiwa. Dalam hal data pelanggan, outlier dapat menjadi ceruk pelanggan berharga yang belum ditangani. Pencilan bisa menjadi tren yang sedang berkembang. Warna merah muda awalnya merupakan warna yang asing tetapi dengan cepat menjadi pilihan fesyen paling populer. 

Sebelum menganggap outlier sebagai kebisingan, gunakanlah outlier untuk memicu pertanyaan dan rasa ingin tahu:   

  • Apakah pencilan menunjukkan adanya peluang?   
  • Mengapa outlier itu ada?   
  • Jika Anda dapat mengubah stempel waktu kumpulan data Anda, apa dampaknya terhadap outlier? 
  • Apakah Anda harus berasumsi jika ada lebih banyak outlier?  
  • Apa yang outlier katakan kepada kita tentang sistem atau proses yang sedang dianalisis?    
  • Apa yang diperlukan agar outlier menjadi profil atau segmen yang berbeda?  

Memahami outlier dapat mengarah pada pengembangan produk yang inovatif, mengidentifikasi peluang pasar baru, dan mengenali potensi risiko. Dalam bidang-bidang seperti ilmu lingkungan atau ekonomi, outlier dapat menandakan perubahan pola yang penting, seperti perubahan iklim yang tiba-tiba atau krisis keuangan. Pencilan berpotensi mengubah cara kita melihat dan menafsirkan data, mengubahnya dari titik data yang disalahpahami menjadi informasi berharga. 

2. “Suatu saat adalah suatu kebetulan. Dua kali adalah suatu kebetulan. Tiga kali adalah tindakan musuh.” -Jari emas  

Pernah bertanya-tanya mengapa orang lain merasa nyaman membuat “Data-driven” keputusan dengan informasi yang sangat terbatas? Lebih banyak titik data membuat kita lebih percaya diri dan akurasi lebih tinggi, namun terkadang, kita perlu bertindak cepat.  

Baru-baru ini, OpenAI meluncurkan ChatGPT meskipun memiliki kekurangan, sementara perusahaan lain yang memiliki produk serupa menunggu untuk meningkatkan tingkat kepercayaan mereka terhadap keakuratan respons. Saat Anda berpikir seseorang membuat keputusan berdasarkan data dengan tingkat kepercayaan rendah dan akurasi terbatas, pertimbangkan kerugian waktu. Musuh mungkin akan menembak. 

3. “Tidak semua hal yang berarti dapat dihitung, dan tidak semua hal yang dapat dihitung berarti.” –umumnya dikaitkan dengan Albert Einstein 

Dengan kata lain, “Saya menghargai analisis data Anda, namun apa yang saya pikirkan atau dengar lebih penting. Itu tidak dapat dihitung atau diukur.” 

Bagaimana tanggapan Anda? Situasi ini adalah saat Anda perlu menjadi kreatif.   

Misalnya, perilaku pelanggan, termasuk sentimen pelanggan, loyalitas merek, dan tren yang didorong oleh perubahan budaya, tidak berwujud dan sulit diukur. Jika Anda hanya memiliki data perilaku online, gunakan metode lain untuk mengakses sumber data baru seperti program pengujian, survei, analisis sentimen sosial, etnografi online, atau riset pelanggan primer yang mendasar.  

Mungkin tidak ada yang pasti, namun kombinasi dan konsistensi berbagai metode dan sumber yang berbeda-bedalah yang menghasilkan kesimpulan yang konsisten.  

4. “Korelasi sama dengan sebab-akibat?”  

Mengganti korelasi sebab akibat dapat menyebabkan pengambilan keputusan yang salah arah jika dilakukan tanpa kesadaran. Namun, ada situasi ketika kami hanya memiliki akses ke data korelasi. Dalam kasus ini, penting untuk meneliti apakah korelasi tersebut hanya kebetulan atau ada penyebab mendasar yang sah. 

Misalnya, pertimbangkan tantangan mengukur atribusi pengeluaran pemasaran dan menganalisis aktivitas penjualan. Ini adalah tugas kompleks yang tidak memiliki hubungan sebab akibat langsung. Seseorang mungkin mengamati tingkat penutupan 90% ketika pelanggan mengunjungi kantor vendor untuk memberikan pengarahan kepada pelanggan, namun penting untuk tidak langsung mengambil kesimpulan dan berasumsi sebab akibat. Sebaliknya, diperlukan pendekatan yang lebih bernuansa.  

Setelah diperiksa lebih dekat, menjadi jelas bahwa tingginya tingkat penutupan bukan hanya disebabkan oleh penjadwalan pengarahan pelanggan untuk setiap interaksi penjualan. Sebaliknya, interaksi itu sendiri menciptakan keinginan klien untuk menghadiri pengarahan tersebut, yang kemudian menyebabkan tingkat penutupan yang tinggi. Contoh ini menggambarkan perpaduan seni dan sains di analisis – sebuah proses yang melibatkan pemahaman dinamika yang mendasarinya dan tidak hanya mengandalkan korelasi yang dangkal. 

Kita semua menginginkan kepercayaan statistik dari banyak data dengan kumpulan data yang ideal. Kenyataannya adalah terkadang, kita harus menjadi kreatif dan imajinatif serta memeriksa outlier, korelasi, dan kumpulan data alternatif. Atau terkadang, tidak ada waktu, dan Anda perlu bertindak berdasarkan data yang terbatas. 

Stempel Waktu:

Lebih dari DATAVERSITAS