Memperkenalkan Konsep Fabric Analisis Data - DATAVERSITY

Memperkenalkan Konsep Data Analytics Fabric – DATAVERSITY

Node Sumber: 2884345

Organisasi di seluruh dunia – baik profit maupun nonprofit – sedang mempertimbangkan untuk memanfaatkan analisis data untuk meningkatkan kinerja bisnis. Temuan dari a Survei McKinsey menunjukkan bahwa organisasi berbasis data memiliki kemungkinan 23 kali lebih besar untuk memperoleh pelanggan, enam kali lebih mungkin mempertahankan pelanggan, dan 19 kali lebih menguntungkan [1]. Penelitian oleh MIT menemukan bahwa perusahaan yang sudah matang secara digital 26% lebih menguntungkan dibandingkan perusahaan sejenis [2]. Namun banyak perusahaan, meskipun kaya akan data, kesulitan menerapkan analisis data karena adanya konflik prioritas antara kebutuhan bisnis, kemampuan yang tersedia, dan sumber daya. Penelitian oleh Gartner menemukan bahwa lebih dari 85% proyek data dan analitik gagal [3] dan a laporan bersama dari IBM dan Carnegie Melon menunjukkan bahwa 90% data dalam suatu organisasi tidak pernah berhasil digunakan untuk tujuan strategis apa pun [4].

Dengan latar belakang ini, kami memperkenalkan konsep “data analysis fabric (DAF)”, sebagai ekosistem atau struktur yang memungkinkan analisis data berfungsi secara efektif berdasarkan (a) kebutuhan atau tujuan bisnis, (b) kemampuan yang tersedia seperti orang/keterampilan , proses, budaya, teknologi, wawasan, kompetensi pengambilan keputusan, dan banyak lagi, dan (c) sumber daya (yaitu, komponen yang dibutuhkan bisnis untuk menjalankan bisnis).

Tujuan utama kami memperkenalkan struktur analisis data adalah untuk menjawab pertanyaan mendasar ini: “Apa yang diperlukan untuk secara efektif membangun sistem pengambilan keputusan dari Ilmu Data algoritma untuk mengukur dan meningkatkan kinerja bisnis?” Struktur analisis data dan lima manifestasi utamanya ditunjukkan dan dibahas di bawah.

Sumber gambar: DBP-Institut

1. Berfokus pada Pengukuran

Pada intinya, analitik adalah tentang penggunaan data untuk memperoleh wawasan, mengukur dan meningkatkan kinerja bisnis [5]. Ada tiga jenis analisis utama untuk mengukur dan meningkatkan kinerja bisnis:

  • Analisis deskriptif mengajukan pertanyaan, “Apa yang terjadi?” Analisis deskriptif digunakan untuk menganalisis data historis untuk mengidentifikasi pola, tren, dan hubungan menggunakan teknik analisis data eksploratif, asosiatif, dan inferensial. Teknik analisis data eksplorasi menganalisis dan merangkum kumpulan data. Analisis deskriptif asosiatif menjelaskan hubungan antar variabel. Analisis data deskriptif inferensial digunakan untuk menyimpulkan atau menyimpulkan tren tentang populasi yang lebih besar berdasarkan kumpulan data sampel. 
  • Analisis prediktif melihat jawaban atas pertanyaan, “Apa yang akan terjadi?” Pada dasarnya, analisis prediktif adalah proses penggunaan data untuk memperkirakan tren dan peristiwa di masa depan. Analisis prediktif dapat dilakukan secara manual (umumnya dikenal sebagai analisis prediktif berbasis analis) atau menggunakan algoritma pembelajaran mesin (juga dikenal sebagai analisis prediktif berbasis data). Apa pun yang terjadi, data historis digunakan untuk membuat prediksi di masa depan.
  • Analisis preskriptif membantu menjawab pertanyaan, “Bagaimana kita dapat mewujudkannya?” Pada dasarnya, analisis preskriptif merekomendasikan tindakan terbaik untuk bergerak maju menggunakan teknik pengoptimalan dan simulasi. Biasanya, analisis prediktif dan analisis preskriptif berjalan bersamaan karena analisis prediktif membantu menemukan hasil potensial, sedangkan analisis preskriptif melihat hasil tersebut dan menemukan lebih banyak opsi.

2. Berfokus pada Variabel

Data juga dapat dianalisis berdasarkan jumlah variabel yang tersedia. Dalam hal ini, berdasarkan jumlah variabelnya, teknik analisis datanya bisa univariat, bivariat, atau multivariat.

  • Analisis Univariat: Analisis univariat melibatkan analisis pola yang ada dalam satu variabel dengan menggunakan ukuran sentralitas (mean, median, modus, dan sebagainya) dan variasi (deviasi standar, kesalahan standar, varians, dan sebagainya).
  • Analisis Bivariat: Terdapat dua variabel yang analisisnya berkaitan dengan sebab dan hubungan kedua variabel tersebut. Kedua variabel ini bisa saling bergantung atau independen satu sama lain. Teknik korelasi merupakan teknik analisis bivariat yang paling banyak digunakan.
  • Analisis Multivariat: Teknik ini digunakan untuk menganalisis lebih dari dua variabel. Dalam pengaturan multivariat, kami biasanya beroperasi di arena analitik prediktif dan sebagian besar algoritme pembelajaran mesin (ML) terkenal seperti regresi linier, regresi logistik, pohon regresi, mesin vektor dukungan, dan jaringan saraf biasanya diterapkan pada multivariat pengaturan.

3. Berfokus pada Pengawasan

Jenis struktur analisis data yang ketiga berkaitan dengan pelatihan data masukan atau data variabel independen yang telah diberi label untuk keluaran tertentu (yaitu, variabel terikat). Pada dasarnya, variabel independen adalah variabel yang dikontrol oleh pelaku eksperimen. Variabel terikat adalah variabel yang berubah sebagai respon terhadap variabel bebas. DAF yang berfokus pada pengawasan dapat terdiri dari dua jenis.

  • Hubungan sebab dan akibat: Data berlabel, baik yang dihasilkan secara otomatis atau manual, sangat penting untuk pembelajaran yang diawasi. Data berlabel memungkinkan seseorang untuk mendefinisikan variabel terikat dengan jelas, dan kemudian bergantung pada algoritma analitik prediktif untuk membangun alat AI/ML yang akan membangun hubungan antara label (variabel terikat) dan kumpulan variabel independen. Fakta bahwa kita mempunyai batasan yang jelas antara pengertian variabel terikat dan sekumpulan variabel bebas, kita membiarkan diri kita memperkenalkan istilah “kausalitas” untuk menjelaskan hubungan tersebut dengan sebaik-baiknya.
  • Non-Kausalitas: Ketika kami mengindikasikan “berfokus pada pengawasan” sebagai dimensi kami, yang kami maksud adalah “tidak adanya pengawasan”, dan hal ini membawa model non-kausal ke dalam diskusi. Model non-kausal patut disebutkan karena tidak memerlukan data berlabel. Teknik dasar di sini adalah clustering, dan metode yang paling populer adalah k-Means dan Hierarchical Clustering.  

4. Berfokus pada Tipe Data

Dimensi atau manifestasi struktur analisis data ini berfokus pada tiga jenis variabel data berbeda yang terkait dengan variabel independen dan dependen yang digunakan dalam teknik analisis data untuk memperoleh wawasan. 

  • Data nominal digunakan untuk memberi label atau mengkategorikan data. Ini tidak melibatkan nilai numerik dan karenanya tidak ada perhitungan statistik yang dapat dilakukan dengan data nominal. Contoh data nominal adalah jenis kelamin, deskripsi produk, alamat pelanggan, dan sejenisnya. 
  • Data ordinal atau berperingkat adalah urutan nilainya, tetapi perbedaan antara masing-masing nilai tidak diketahui secara pasti. Contoh umum di sini adalah pemeringkatan perusahaan berdasarkan kapitalisasi pasar, syarat pembayaran vendor, skor kepuasan pelanggan, prioritas pengiriman, dan sebagainya. 
  • Data numerik tidak perlu diperkenalkan dan bernilai numerik. Variabel-variabel ini adalah tipe data paling mendasar yang dapat digunakan untuk memodelkan semua jenis algoritma.  

5. Berfokus pada Hasil

Jenis struktur analisis data ini melihat cara-cara di mana nilai bisnis dapat disampaikan dari wawasan yang diperoleh dari analisis. Ada dua cara di mana nilai bisnis dapat didorong oleh analitik, yaitu melalui produk atau proyek. Meskipun produk mungkin perlu mengatasi dampak tambahan seputar pengalaman pengguna dan rekayasa perangkat lunak, latihan pemodelan yang dilakukan untuk mendapatkan model akan serupa baik dalam proyek maupun produk.

  • A produk analisis data adalah aset data yang dapat digunakan kembali untuk melayani kebutuhan bisnis jangka panjang. Ia mengumpulkan data dari sumber data yang relevan, memastikan kualitas data, memprosesnya, dan membuatnya dapat diakses oleh siapa saja yang membutuhkannya. Produk biasanya dirancang untuk persona dan memiliki beberapa tahapan siklus hidup atau iterasi di mana nilai produk diwujudkan.
  • proyek analitik data dirancang untuk memenuhi kebutuhan bisnis tertentu atau unik dan memiliki basis atau tujuan pengguna yang jelas atau sempit. Pada dasarnya, proyek adalah upaya sementara yang dimaksudkan untuk memberikan solusi dalam lingkup tertentu, sesuai anggaran, dan tepat waktu.

Perekonomian dunia akan berubah secara dramatis di tahun-tahun mendatang seiring dengan semakin banyaknya organisasi yang menggunakan data dan analisis untuk memperoleh wawasan dan mengambil keputusan guna mengukur dan meningkatkan kinerja bisnis. McKinsey menemukan bahwa perusahaan yang berbasis wawasan melaporkan peningkatan EBITDA (laba sebelum bunga, pajak, depresiasi, dan amortisasi) hingga 25% [5]. Namun, banyak organisasi tidak berhasil memanfaatkan data dan analitik untuk meningkatkan hasil bisnis. Namun tidak ada satu cara atau pendekatan standar untuk menyampaikan analisis data. Penyebaran atau penerapan solusi analisis data bergantung pada tujuan, kemampuan, dan sumber daya bisnis. DAF dan lima perwujudannya yang dibahas di sini dapat memungkinkan analitik diterapkan secara efektif berdasarkan kebutuhan bisnis, kemampuan yang tersedia, dan sumber daya.

Referensi

  1. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/five-facts-how-customer-analytics-boosts-corporate-kinerja
  2. ide.mit.edu/insights/perusahaan-yang-matang-secara-digital-26-lebih-menguntungkan-dibandingkan-rekan-rekannya/
  3. gartner.com/en/newsroom/press-releases/2018-02-13-gartner-says-hampir-setengah-dari-cios-berencana-untuk-menyebarkan-kecerdasan-buatan
  4. forbes.com/sites/forbestechcouncil/2023/04/04/three-key-misconceptions-of-data-quality/?sh=58570fc66f98
  5. Southekal, Prashanth, “Praktik Terbaik Analisis”, Teknik, 2020
  6. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/insights-to-impact-creating-and-sustaining-data-driven-commercial-growth

Stempel Waktu:

Lebih dari DATAVERSITAS