Спостереженість даних: що це таке і чому це важливо - DATAVERSITY

Спостереженість даних: що це таке і чому це важливо – DATAVERSITY

Вихідний вузол: 2691645
спостережуваність данихспостережуваність даних

Спостереженість даних як процес використовується компаніями, які працюють з величезними обсягами даних. Багато великих сучасних організацій намагаються контролювати свої дані за допомогою різноманітних програм та інструментів. На жаль, небагато компаній розвивають видимість, необхідну для реалістичного огляду. 

Спостереженість даних забезпечує такий огляд, щоб якомога швидше усунути проблеми з потоком даних.

Процес спостереження включає різноманітні методи та технології, які допомагають виявляти та вирішувати проблеми з даними в реальному часі. Цей процес створює багатовимірну карту всього потоку даних компанії, пропонуючи більш глибоке розуміння продуктивності системи та якості даних. 

Відповідаючи на запитання про можливість спостереження за даними, Райан Якел, директор з маркетингу Databand, компанії IBM, прокоментував:

«Оскільки обсяг, швидкість і складність конвеєрів великих даних продовжують зростати, компанії покладаються на команди розробки даних і платформи як на основу свого бізнесу, керованого даними. Проблема полягає в тому, що більшість із цих команд мають свої завдання. Вони борються з даними за допомогою інцидентів надійності та якості, що ускладнює зосередження на стратегічних ініціативах, пов’язаних із AL/ML, аналітикою та продуктами даних. Спостереженість даних є рішенням».

Спочатку можливість спостереження за даними може здатися формою родовід даних, але ці два процеси служать різним цілям. 

Спостереженість даних спрямована на швидке й ефективне вирішення проблем із даними за допомогою системи вимірювання. Проте походження даних використовується переважно для збору та зберігання високоякісних даних – даних, яким можна довіряти.

Крім того, походження даних можна використовувати як компонент для підтримки програми спостереження. (Деякі статті пропагують спостережуваність даних як таку саму мету, що й походження даних, і в цьому твердженні є частка правди. Походження даних є компонентом спостережуваності даних.) 

Термін «спостережливість» спочатку був філософською концепцією, розробленою Гераклітом близько 510 року до нашої ери. Він визначив, що спостережливість вимагає порівняльних відмінностей – холод можна спостерігати порівняно з теплом. У 1871 році фізик Джеймс К. Максвелл розвинув ідею про те, що неможливо дізнатися розташування всіх частинок у термодинамічному експерименті, але спостерігаючи за «певними ключовими результатами» для порівняльних змін, можна зробити точні прогнози. 

Опис спостережуваності Максвелла з використанням ключових вихідних даних був адаптований і застосований до різноманітних автоматизованих програм, починаючи від заводського обладнання і закінчуючи датчиками літаків. Потім ця концепція була прийнята DevOps для налагодження та вирішення «виробничих інцидентів» приблизно у 2016 році. У 2019 році Барр Мозес, генеральний директор і співзасновник Monte Carlo, розробив процес спостережуваності, призначений для надання огляду потоку даних організації. . 

Мойсей написав

«Можливість спостереження за даними — це здатність організації повністю розуміти справність даних у своїх системах. Спостереженість даних усуває простої даних завдяки застосуванню найкращих практик DevOps до спостережуваність конвеєра даних».

П’ять основ спостережуваності даних

Спостереженість даних працює для вирішення проблем із даними та інформацією, надаючи повну карту даних у режимі реального часу. Він забезпечує видимість діяльності організації з даними. Багато компаній мають дані, які є закритими, блокуючи можливість спостереження. Щоб підтримувати програму спостереження за даними, слід усунути відокремлені дані. 

Коли такі дії, як відстеження, моніторинг, попередження, аналіз, журналювання та «порівняння», виконуються без панелі спостережень, може мати місце певна форма організаційного поділу. Люди в одному відділі не усвідомлюють, що їхні зусилля призводять до непередбачуваних наслідків в іншому відділі, наприклад, відсутня/розсіяна інформація, що сприяє прийняттю неправильних рішень, або частина системи не працює, і ніхто цього не усвідомлює. 

Пам’ятайте, що спостережливість означає вимірювання певних ключових результатів. П’ять основних (або ключових результатів), розроблених Barr Moses для цілей вимірювання, це: 

  • Якість: Дані високої якості вважаються точними, а дані низької якості – ні. Вимірювання якості даних дає зрозуміти, чи можна довіряти вашим даним. Є різноманітні способи для вимірювання Якість дати.
  • Схема: Це передбачає зміни в організації даних, а вимірювання схеми можуть показати перерви в потоці даних. Визначення того, коли, як і хто вніс зміни, може бути корисним з точки зору профілактичного обслуговування. 
  • Об'єм: Великі обсяги даних корисні для дослідницьких і маркетингових цілей. Це може надати організаціям комплексне уявлення про своїх клієнтів і ринок. Чим більше поточних та історичних даних використано під час дослідження, тим більше розуміння.
  • Родовід даних: Хороша програма визначення походження даних записує зміни в даних і їхньому розташуванні та зазвичай використовується для покращення якості даних. Однак його також можна використовувати як частину програми спостереження за даними. У цій якості він використовується для усунення несправностей, які можуть виникнути, і перерахування того, що було зроблено до пошкодження. 
  • Свіжість: По суті, мова йде про те, щоб не використовувати стару інформацію або, як це називає Барр Мозес, застарілі дані. Свіжість наголошує на актуальних даних, що важливо під час прийняття рішень на основі даних. Мітки часу зазвичай використовуються, щоб визначити, чи дані застарілі. 

У поєднанні вимірювання цих компонентів або стовпів можуть дати цінну інформацію про проблеми, які розвиваються або просто з’являються, і сприяти якнайшвидшому ремонту.

Проблеми спостереження даних

Правильна платформа спостереження за даними може змінити те, як компанії обслуговують свої дані та керують ними. На жаль, впровадження платформи може спричинити певні труднощі. Проблеми сумісності виникають, коли платформа погано підходить. 

Платформи та інструменти спостереження можуть бути обмежені, якщо конвеєр даних, програмне забезпечення, сервери та бази даних не є повністю сумісними. Ці платформи не працюють у вакуумі, тому важливо їх усунути силоси даних від системи та переконайтеся, що всі системи даних в організації інтегровані. 

Перед підписанням контракту важливо перевірити платформу спостереження за даними.

На жаль, навіть коли всі внутрішні та зовнішні джерела даних компанії правильно інтегровані в платформу, вони відрізняються моделі даних може спричинити проблеми. Багато компаній підтримують 400 або більше джерел даних, і кожне зовнішнє джерело може становити проблему, якщо воно не використовує однакові стандарти та формати.

За винятком інструментів з відкритим вихідним кодом, платформи спостереження є хмарними, і вони можуть запропонувати певну гнучкість, що підтримує тонке налаштування. 

Найкращі платформи спостереження орієнтовані на стандартизований процес вимірювання та вказівки щодо реєстрації. Це сприяє ефективній кореляції інформації, але зовнішні джерела даних і налаштовані конвеєри даних можуть спричинити проблеми та вимагати додаткових ручних зусиль для виконання завдань, які мали бути автоматизованими.

Крім того, деякі інструменти можуть мати незвичайні витрати на зберігання, що обмежує масштабованість.

Платформи спостереження за даними

Платформи спостереження за даними зазвичай містять різноманітні корисні інструменти. Вони часто включають автоматизовану підтримку автоматизованого походження даних, аналіз першопричин, якість даних і моніторинг для виявлення, вирішення та запобігання аномаліям у потокі даних. 

Платформи сприяють підвищенню продуктивності, здоровішому конвеєру та щасливішим клієнтам. Деякі популярні платформи спостереження даних:

  • Діапазон даних забезпечує високофункціональну платформу спостереження, яка може дуже швидко виявляти та вирішувати проблеми з даними, використовуючи безперервний процес спостереження, який визначає проблеми з даними до того, як вони вплинуть на ваш бізнес. 
  • Монте-Карло пропонує платформу спостережуваності, яку можна описати як забезпечення спостережуваності «від конвеєра до бізнес-аналітика.” Це забезпечує надійність даних для оркестровки різних служб даних і інструментів. 
  • Метаплан має можливість наскрізного спостереження.

Важливість спостережуваності даних

Для організацій, які мають справу з великими потоками даних, спостережливість може бути використана для моніторингу системи даних у цілому та надсилання червоних прапорців, коли виникає проблема. 

Оскільки підприємства збирають величезні обсяги даних із різноманітних джерел, вони розробляють системи для їх обробки, шар за шаром. Ці системи включають сховище даних, конвеєри даних і ряд інструментів. Кожен додатковий рівень складності збільшує ймовірність простою даних через такі проблеми, як несумісність або старі та відсутні дані.

За словами Якеля, «безперервне використання спостережуваності даних для моніторингу конвеєрів даних, наборів даних і таблиць даних попереджає команди обробки даних, коли відбувається інцидент із даними, і показує, як усунути першопричину, перш ніж це вплине на їхній бізнес. Завдяки можливості спостереження за даними інженерія може зосередитися на створенні чудових продуктів із даними, а не на підтримці зламаних процесів». 

Можливість спостереження за даними допоможе компаніям завчасно визначати джерело проблем із конвеєрами, помилок даних і неузгодженості потоків даних, щоб зміцнити відносини з клієнтами та покращити якість даних.

Зображення використовується за ліцензією Shutterstock.com

Часова мітка:

Більше від ПЕРЕДАЧА