Представляємо концепцію Data Analytics Fabric - DATAVERSITY

Представляємо концепцію Data Analytics Fabric – DATAVERSITY

Вихідний вузол: 2884345

Організації в усьому світі – як комерційні, так і некомерційні – прагнуть використовувати аналітику даних для покращення ефективності бізнесу. Висновки з a Опитування McKinsey вказують на те, що організації, які керуються даними, у 23 рази частіше залучають клієнтів, у шість разів частіше утримують клієнтів і в 19 разів більш прибуткові [1]. Дослідження MIT виявили, що цифрово зрілі фірми на 26% прибутковіші за своїх аналогів [2]. Але багатьом компаніям, незважаючи на велику кількість даних, важко впровадити аналітику даних через суперечливі пріоритети між бізнес-потребами, наявними можливостями та ресурсами. Дослідження Gartner виявили, що понад 85% проектів даних і аналітики зазнають невдачі [3] і a спільна доповідь від IBM і Carnegie Melon показує, що 90% даних в організації ніколи не використовуються успішно для будь-яких стратегічних цілей [4].

На цьому фоні ми представляємо концепцію «ткані аналітики даних (DAF)» як екосистему або структуру, яка дозволяє аналітиці даних ефективно функціонувати на основі (а) бізнес-потреб або цілей, (б) наявних можливостей, таких як люди/навички , процеси, культура, технології, ідеї, компетенції щодо прийняття рішень тощо, а також (c) ресурси (тобто компоненти, необхідні підприємству для ведення бізнесу).

Наша головна мета представлення структури аналізу даних — відповісти на це фундаментальне запитання: «Що потрібно для ефективного створення системи прийняття рішень із наука даних алгоритмів для вимірювання та покращення ефективності бізнесу?» Структура аналітики даних і її п’ять ключових проявів показані та обговорені нижче.

Джерело зображення: ДБП-Інститут

1. Орієнтований на вимірювання

За своєю суттю, аналітика полягає в використанні даних для отримання оцінок і покращення ефективності бізнесу [5]. Існує три основні типи аналітики для вимірювання та покращення ефективності бізнесу:

  • Описова аналітика задає питання: «Що сталося?» Описова аналітика використовується для аналізу історичних даних для виявлення закономірностей, тенденцій і зв’язків за допомогою дослідницьких, асоціативних і логічних методів аналізу даних. Методи дослідницького аналізу даних аналізують і узагальнюють набори даних. Асоціативний описовий аналіз пояснює зв'язок між змінними. Інференційний описовий аналіз даних використовується для висновку або висновку про тенденції щодо більшої сукупності на основі вибіркового набору даних. 
  • Прогностична аналітика дивиться на відповідь на запитання: «Що станеться?» По суті, прогнозна аналітика – це процес використання даних для прогнозування майбутніх тенденцій і подій. Прогнозний аналіз можна проводити вручну (широко відомий як прогнозна аналітика, керована аналітиком) або за допомогою алгоритми машинного навчання (також відома як прогнозна аналітика на основі даних). У будь-якому випадку історичні дані використовуються для прогнозування майбутнього.
  • Настановна аналітика допомагає відповісти на запитання: «Як це зробити?» По суті, приписна аналітика рекомендує найкращий курс дій для просування вперед за допомогою методів оптимізації та моделювання. Як правило, прогнозний аналіз і прескриптивна аналітика поєднуються, оскільки прогнозна аналітика допомагає знайти потенційні результати, тоді як прескриптивна аналітика розглядає ці результати та знаходить більше варіантів.

2. Змінна орієнтація

Дані також можна аналізувати на основі кількості доступних змінних. У зв’язку з цим, на основі кількості змінних методи аналізу даних можуть бути однофакторними, двофакторними або багатофакторними.

  • Одновимірний аналіз: Однофакторний аналіз передбачає аналіз моделі, присутньої в одній змінній, за допомогою показників центральності (середнє значення, медіана, мода тощо) та варіації (стандартне відхилення, стандартна помилка, дисперсія тощо).
  • Двовимірний аналіз: Є дві змінні, аналіз яких пов’язаний із причиною та зв’язком між двома змінними. Ці дві змінні можуть бути залежними або незалежними одна від одної. Техніка кореляції є найбільш використовуваною технікою двовимірного аналізу.
  • Багатофакторний аналіз: Ця техніка використовується для аналізу більше ніж двох змінних. У багатовимірних умовах ми зазвичай працюємо на арені прогнозної аналітики, і більшість відомих алгоритмів машинного навчання (ML), таких як лінійна регресія, логістична регресія, регресійні дерева, опорні векторні машини та нейронні мережі, як правило, застосовуються до багатовимірних налаштування.

3. Орієнтований на нагляд

Третій тип структури аналізу даних стосується навчання вхідних даних або даних незалежної змінної, які були позначені для певного виходу (тобто залежної змінної). По суті, незалежна змінна – це та, якою керує експериментатор. Залежна змінна - це змінна, яка змінюється у відповідь на незалежну змінну. Орієнтований на нагляд DAF може бути одного з двох типів.

  • Причинність: Дані з мітками, згенеровані автоматично чи вручну, є важливими для навчання під наглядом. Дані з мітками дозволяють чітко визначити залежну змінну, а потім це питання алгоритму прогнозної аналітики для створення інструменту AI/ML, який би побудував зв’язок між міткою (залежною змінною) і набором незалежних змінних. Той факт, що ми маємо чітке розмежування між поняттями залежної змінної та набором незалежних змінних, ми дозволяємо собі ввести термін «причинність», щоб найкраще пояснити зв’язок.
  • Непричинність: Коли ми вказуємо «зосередженість на нагляді» як наш вимір, ми також маємо на увазі «відсутність нагляду», і це призводить до обговорення непричинних моделей. Непричинні моделі заслуговують на згадку, оскільки вони не потребують позначених даних. Основною технікою тут є кластеризація, а найпопулярнішими методами є k-середні та ієрархічна кластеризація.  

4. Орієнтований на тип даних

Цей вимір або прояв структури аналітики даних зосереджується на трьох різних типах змінних даних, пов’язаних як з незалежними, так і з залежними змінними, які використовуються в техніках аналітики даних для отримання розуміння. 

  • Номінальні дані використовується для маркування або категоризації даних. Він не передбачає числового значення, а тому статистичні розрахунки з номінальними даними неможливі. Прикладами номінальних даних є стать, опис товару, адреса клієнта тощо. 
  • Порядкові або ранжовані дані це порядок значень, але відмінності між кожним із них насправді невідомі. Типовими прикладами тут є рейтинг компаній на основі ринкової капіталізації, умов оплати постачальника, показників задоволеності клієнтів, пріоритету доставки тощо. 
  • Числові дані не потребує представлення та має числове значення. Ці змінні є найбільш фундаментальними типами даних, які можна використовувати для моделювання всіх типів алгоритмів.  

5. Орієнтованість на результат

Цей тип структури аналітики даних розглядає способи, якими можна отримати бізнес-цінність на основі розуміння, отриманого за допомогою аналітики. Є два способи, за допомогою яких аналітика може підвищити цінність бізнесу, і це через продукти або проекти. Хоча в продуктах може знадобитися усунути додаткові наслідки взаємодії з користувачем і розробку програмного забезпечення, моделювання, виконане для отримання моделі, буде подібним як у проекті, так і в продукті.

  • A продукт аналітики даних це багаторазовий ресурс даних для обслуговування довгострокових потреб бізнесу. Він збирає дані з відповідних джерел даних, забезпечує якість даних, обробляє їх і робить їх доступними для всіх, хто їх потребує. Продукти, як правило, розроблені для персон і мають кілька етапів життєвого циклу або ітерацій, на яких реалізується цінність продукту.
  • проект аналітики даних призначений для вирішення певних або унікальних бізнес-потреб і має визначену або вузьку базу користувачів або мету. По суті, проект — це тимчасова робота, спрямована на надання рішення для певного обсягу, у межах бюджету та вчасно.

У найближчі роки світова економіка кардинально зміниться, оскільки організації все частіше використовуватимуть дані та аналітику для отримання розуміння та прийняття рішень для вимірювання та покращення ефективності бізнесу. McKinsey виявили, що компанії, які керуються розумінням, звітують про EBITDA (прибуток до сплати відсотків, податків, амортизації та амортизації) на 25% [5]. Однак багатьом організаціям не вдається використовувати дані та аналітику для покращення бізнес-результатів. Але не існує єдиного стандартного способу чи підходу до надання аналітики даних. Розгортання або впровадження рішень аналітики даних залежить від бізнес-цілей, можливостей і ресурсів. DAF і п’ять його проявів, про які тут йдеться, можуть забезпечити ефективне розгортання аналітики на основі бізнес-потреб, наявних можливостей і ресурсів.

посилання

  1. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/five-facts-how-customer-analytics-boosts-corporate-performance
  2. ide.mit.edu/insights/digitally-mature-firms-are-26-more-profitable-than-their-peers/
  3. gartner.com/en/newsroom/press-releases/2018-02-13-gartner-says-nearly-half-of-cios-are-planning-to-deploy-artificial-intelligence
  4. forbes.com/sites/forbestechcouncil/2023/04/04/three-key-misconceptions-of-data-quality/?sh=58570fc66f98
  5. Southekal, Prashanth, «Analytics Best Practices», Technics, 2020
  6. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/insights-to-impact-creating-and-sustaining-data-driven-commercial-growth

Часова мітка:

Більше від ПЕРЕДАЧА