Veri Analitiği Yapısı Konseptine Giriş - DATAVERSITY

Veri Analitiği Yapısı Konseptine Giriş – DATAVERSITY

Kaynak Düğüm: 2884345

Dünyanın her yerindeki kuruluşlar (hem kâr amacı güden hem de kâr amacı gütmeyen kuruluşlar) iş performansını artırmak için veri analitiğinden yararlanmanın yollarını arıyor. Bulgular bir McKinsey araştırması veri odaklı kuruluşların müşteri kazanma olasılığının 23 kat, müşterileri elde tutma olasılığının altı kat ve 19 kat daha karlı olduğunu göstermektedir [1]. MIT'in araştırması dijital olarak olgun firmaların emsallerine göre %26 daha karlı olduğunu buldu [2]. Ancak birçok şirket, veri açısından zengin olmasına rağmen iş ihtiyaçları, mevcut yetenekler ve kaynaklar arasındaki çelişen öncelikler nedeniyle veri analitiğini uygulamakta zorlanıyor. Gartner tarafından yapılan araştırma veri ve analiz projelerinin %85'inden fazlasının başarısız olduğunu buldu [3] ve ortak rapor IBM ve Carnegie Melon'dan gelen veriler, bir kuruluştaki verilerin %90'ının hiçbir zaman herhangi bir stratejik amaç için başarıyla kullanılmadığını gösteriyor [4].

Bu arka planla, veri analitiğinin (a) iş ihtiyaçları veya hedeflerine, (b) insanlar/beceriler gibi mevcut yeteneklere dayalı olarak etkili bir şekilde çalışmasını sağlayan bir ekosistem veya yapı olarak "veri analitiği dokusu (DAF)" konseptini tanıtıyoruz. , süreçler, kültür, teknolojiler, içgörüler, karar verme yetkinlikleri ve daha fazlası ve (c) kaynaklar (yani bir işletmenin işi yürütmek için ihtiyaç duyduğu bileşenler).

Veri analitiği dokusunu tanıtmaktaki temel amacımız şu temel soruyu yanıtlamaktır: "Karar verme sistemini etkili bir şekilde oluşturmak için ne gereklidir?" Veri Bilim iş performansını ölçecek ve iyileştirecek algoritmalar mı?” Veri analitiği dokusu ve onun beş temel tezahürü aşağıda gösterilmiş ve tartışılmıştır.

Görüntü kaynağı: DBP-Enstitüsü

1. Ölçüm Odaklı

Analitik, özünde, iş performansını ölçmek ve iyileştirmek için içgörü elde etmek için verileri kullanmakla ilgilidir [5]. İş performansını ölçmek ve geliştirmek için üç ana analiz türü vardır:

  • Açıklayıcı analitik “Ne oldu?” sorusunu sorar. Tanımlayıcı analitik, keşifsel, ilişkisel ve çıkarımsal veri analizi tekniklerini kullanarak kalıpları, eğilimleri ve ilişkileri belirlemek amacıyla geçmiş verileri analiz etmek için kullanılır. Keşifsel veri analizi teknikleri veri setlerini analiz eder ve özetler. İlişkisel betimsel analiz değişkenler arasındaki ilişkiyi açıklar. Çıkarımsal tanımlayıcı veri analizi, örnek veri setine dayalı olarak daha büyük bir popülasyon hakkındaki eğilimleri çıkarmak veya sonuçlandırmak için kullanılır. 
  • Öngörücü analitik “Ne olacak?” sorusunun cevabını arıyor. Temel olarak tahmine dayalı analitik, gelecekteki eğilimleri ve olayları tahmin etmek için verileri kullanma sürecidir. Tahmine dayalı analiz manuel olarak (yaygın olarak analist odaklı tahmine dayalı analitik olarak bilinir) veya kullanılarak gerçekleştirilebilir. makine öğrenme algoritmaları (veriye dayalı tahmine dayalı analitik olarak da bilinir). Her iki durumda da geçmiş veriler geleceğe yönelik tahminlerde bulunmak için kullanılır.
  • Normatif analitik “Bunu nasıl gerçekleştirebiliriz?” sorusunun cevabını bulmaya yardımcı olur. Temel olarak kuralcı analitik, optimizasyon ve simülasyon tekniklerini kullanarak ilerlemek için en iyi eylem planını önerir. Tipik olarak, tahmine dayalı analiz ve kuralcı analitik bir arada yürür çünkü tahmine dayalı analiz potansiyel sonuçların bulunmasına yardımcı olurken, kuralcı analitik bu sonuçlara bakar ve daha fazla seçenek bulur.

2. Değişken Odaklı

Veriler ayrıca mevcut değişkenlerin sayısına göre de analiz edilebilir. Bu bağlamda veri analitiği teknikleri değişken sayısına bağlı olarak tek değişkenli, iki değişkenli veya çok değişkenli olabilir.

  • Tek Değişkenli Analiz: Tek değişkenli analiz, merkezilik (ortalama, medyan, mod vb.) ve varyasyon (standart sapma, standart hata, varyans vb.) ölçümlerini kullanarak tek bir değişkende mevcut olan modelin analiz edilmesini içerir.
  • İki Değişkenli Analiz: Analizin nedene ve iki değişken arasındaki ilişkiye ilişkin olduğu iki değişken vardır. Bu iki değişken birbirine bağımlı veya bağımsız olabilir. Korelasyon tekniği en çok kullanılan iki değişkenli analiz tekniğidir.
  • Çok Değişkenli Analiz: Bu teknik ikiden fazla değişkenin analizinde kullanılır. Çok değişkenli bir ortamda, genellikle tahmine dayalı analitik alanında çalışırız ve doğrusal regresyon, lojistik regresyon, regresyon ağaçları, destek vektör makineleri ve sinir ağları gibi iyi bilinen makine öğrenimi (ML) algoritmalarının çoğu genellikle çok değişkenli bir yapıya uygulanır. ayar.

3. Denetim Odaklı

Üçüncü tür veri analitiği yapısı, belirli bir çıktı (yani bağımlı değişken) için etiketlenmiş girdi verilerinin veya bağımsız değişken verilerinin eğitimiyle ilgilidir. Temel olarak bağımsız değişken deneycinin kontrol ettiği değişkendir. Bağımlı değişken, bağımsız değişkene tepki olarak değişen değişkendir. Denetim odaklı DAF iki türden biri olabilir.

  • Nedensellik: Otomatik veya manuel olarak oluşturulan etiketli veriler denetimli öğrenme için önemlidir. Etiketlenmiş veriler, bağımlı bir değişkenin açıkça tanımlanmasına olanak tanır ve ardından etiket (bağımlı değişken) ile bağımsız değişkenler kümesi arasında bir ilişki kuracak bir AI/ML aracı oluşturmak, tahmine dayalı analitik algoritmanın meselesidir. Bağımlı değişken kavramı ile bir dizi bağımsız değişken arasında belirgin bir sınıra sahip olduğumuz gerçeğinden dolayı, ilişkiyi en iyi şekilde açıklamak için kendimize "nedensellik" terimini tanıtmamıza izin veriyoruz.
  • Nedensel Olmama: Boyutumuzu “denetim odaklı” olarak belirttiğimizde aynı zamanda “denetim eksikliği”ni de kastediyoruz ve bu da nedensel olmayan modelleri tartışmaya açıyor. Nedensel olmayan modeller, etiketlenmiş verilere ihtiyaç duymadıkları için anılmayı hak etmektedir. Buradaki temel teknik kümelemedir ve en popüler yöntemler k-Ortalamalar ve Hiyerarşik Kümelemedir.  

4. Veri Türü Odaklı

Veri analitiği dokusunun bu boyutu veya tezahürü, içgörü elde etmek için veri analitiği tekniklerinde kullanılan hem bağımsız hem de bağımlı değişkenlerle ilgili üç farklı veri değişkeni türüne odaklanır. 

  • Nominal veri Verileri etiketlemek veya kategorilere ayırmak için kullanılır. Sayısal bir değer içermediğinden nominal verilerle istatistiksel hesaplama yapılması mümkün değildir. Nominal verilere örnek olarak cinsiyet, ürün açıklaması, müşteri adresi ve benzeri verilebilir. 
  • Sıralı veya sıralanmış veriler değerlerin sırasıdır ancak her birinin arasındaki farklar tam olarak bilinmemektedir. Buradaki yaygın örnekler, şirketlerin piyasa değeri, satıcı ödeme koşulları, müşteri memnuniyeti puanları, teslimat önceliği vb. temel alınarak sıralanmasıdır. 
  • Sayısal veriler tanıtım gerektirmez ve değeri sayısaldır. Bu değişkenler her türlü algoritmayı modellemek için kullanılabilecek en temel veri türleridir.  

5. Sonuç Odaklı

Bu tür veri analitiği yapısı, analitikten elde edilen içgörülerden iş değerinin nasıl elde edilebileceğine bakar. İş değerinin analitiklerle yönlendirilebilmesinin iki yolu vardır ve bunlar ürünler veya projeler aracılığıyladır. Ürünlerin kullanıcı deneyimi ve yazılım mühendisliği etrafındaki ek sonuçları ele alması gerekebilirken, modelin türetilmesi için yapılan modelleme çalışması hem projede hem de üründe benzer olacaktır.

  • A veri analitiği ürünü işletmenin uzun vadeli ihtiyaçlarına hizmet edecek yeniden kullanılabilir bir veri varlığıdır. İlgili veri kaynaklarından veri toplar, veri kalitesini sağlar, işler ve ihtiyacı olan herkesin erişimine sunar. Ürünler genellikle kişilere yönelik olarak tasarlanır ve ürün değerinin gerçekleştiği birden fazla yaşam döngüsü aşamasına veya tekrarına sahiptir.
  • veri analitiği projesi belirli veya benzersiz bir iş ihtiyacını karşılamak üzere tasarlanmıştır ve tanımlanmış veya dar bir kullanıcı tabanına veya amacına sahiptir. Temel olarak proje, belirlenen kapsam için çözümü bütçe dahilinde ve zamanında teslim etmeyi amaçlayan geçici bir çabadır.

Kuruluşlar, iş performansını ölçmek ve iyileştirmek amacıyla içgörü elde etmek ve kararlar almak için verileri ve analitiği giderek daha fazla kullandıkça, dünya ekonomisi önümüzdeki yıllarda dramatik bir şekilde dönüşecek. McKinsey içgörü odaklı şirketlerin FAVÖK'ünü (faiz, vergi, amortisman ve amortisman öncesi kazanç) %25'e kadar arttığını buldu [5]. Ancak birçok kuruluş, iş sonuçlarını iyileştirmek için veri ve analitiklerden yararlanma konusunda başarılı olamıyor. Ancak veri analitiğini sunmanın tek bir standart yolu veya yaklaşımı yoktur. Veri analitiği çözümlerinin konuşlandırılması veya uygulanması iş hedeflerine, yeteneklere ve kaynaklara bağlıdır. Burada tartışılan DAF ve onun beş tezahürü, analitiğin iş ihtiyaçlarına, mevcut yeteneklere ve kaynaklara göre etkili bir şekilde dağıtılmasını sağlayabilir.

Referanslar

  1. mckinsey.com/capaabilitys/büyüme-pazarlama-ve-satışlar/bizim-içgörülerimiz/beş-gerçek-nasıl-müşteri-analitik-artırır-kurumsal-performansı
  2. ide.mit.edu/insights/digitally-olgun-firmalar-emsallerinden-26-daha-karlıdır/
  3. gartner.com/en/newsroom/press-releases/2018-02-13-gartner-cios'un-neredeyse yarısının-yapay-zekayı-dağıtmayı-planladığını söylüyor
  4. forbes.com/sites/forbestechcouncil/2023/04/04/three-key-misconceptions-of-data-quality/?sh=58570fc66f98
  5. Southekal, Prashanth, "Analitikte En İyi Uygulamalar", Technics, 2020
  6. mckinsey.com/capaabilitys/büyüme-pazarlama-ve-satışlar/bizim-içgörülerimiz/insights-to-etki-oluşturma-ve-sürdürme-veri odaklı-ticari-büyüme

Zaman Damgası:

Den fazla VERİLER