Концепції моделювання даних для початківців

Концепції моделювання даних для початківців

Вихідний вузол: 2623283
концепції моделювання данихконцепції моделювання даних

Концепції моделювання даних підтримують цілісну картину того, як дані переміщуються системою. Моделювання даних можна описати як процес проектування системи даних або частини системи даних. Ці моделі можуть варіюватися від систем зберігання до баз даних і всієї структури даних організації. Моделі даних можна використовувати як проект для впровадження нової системи або як довідковий матеріал для систем, які вже створені. 

«Повна» модель даних повинна передавати типи даних, які використовуються та зберігаються в системі даних, формати, що використовуються, зв’язки між файлами даних і способи групування та організації даних.

Багато підприємств розробляють унікальні індивідуальні моделі даних (і отримані в результаті унікальні індивідуальні системи даних), побудовані відповідно до конкретних потреб і вимог організації. Ці моделі можна використовувати для візуалізації руху даних у системі. Модель даних може намагатися охопити всі аспекти потоку даних через організацію або конкретні параметри, такі як показ лише даних про продажі для дослідницьких цілей.

Добре розроблена модель даних пояснює бізнес-правила, а також потреба в відповідність законодавству даних.

У процесі моделювання даних є три фази: концептуальна модель, логічна модель і фізична модель. Кожна фаза або стадія розробки моделі служить певній меті. Крім того, існує кілька «видів» моделей.

Візуальні моделі даних схожі на креслення архітектора та можуть підтримуватися пов’язаним текстом, щоб надати вказівки під час розробки або зміни системи даних. Можна знайти приклади візуальних моделей даних тут.

Переваги та проблеми моделювання даних

Розробка моделі даних надає карту та інструмент зв’язку для створення або модифікації системи даних. Концепції моделювання даних значно полегшують створення системи даних. Нещодавно створена база даних та/або система даних повинна підтримувати хороші організаційні комунікації. Він також має підтримувати проекти в реальному часі, включаючи збір даних про моделі витрат, рахунки та інші бізнес-процеси.

Для ідентифікації можна використовувати процес моделювання даних Проблеми з якістю даних, включаючи дублікати, зайві та відсутні дані.

Однією з труднощів у створенні моделі даних є відсутність розуміння систем даних – проблема, яка зазвичай усувається шляхом створення моделі. Інша проблема полягає в тому, що невелика зміна в одній сфері може вимагати значних змін в інших сферах. Крім того, можна легко настільки зосередитися на структурі системи даних, що сильні та слабкі сторони окремих програм ігноруються.

Важливі запитання

Розробка моделі даних починається зі збору інформації про потреби, вимоги та цілі організації. Модель частини системи вимагатиме менше питань, ніж розробка моделі абсолютно нової системи. Нижче наведено кілька основних запитань щодо моделі частини системи: 

  • Яка мета чи мета змін?
  • З якими типами даних зараз працює система?
  • Які дані потрібні?
  • Які інструменти чи програмне забезпечення потрібні для досягнення мети?
  • Чи сумісні інструменти чи програмне забезпечення?

Модель даних має будуватися відповідно до потреб організації та є важливим фактором у розробці нової моделі або коригуванні старої. Питання, які задають під час проектування бази даних або абсолютно нової системи, часто вимагають набагато розширеніших відповідей. Відповідаючи на такі запитання, найкраще включити п’ятирічний бізнес-план: 

  • Які цілі бізнесу (дослідження, продажі, розробка додатків, бухгалтерські послуги)? Це дозволить визначити найкращі типи програмного забезпечення для підтримки бізнесу (NoSQL або графіка для досліджень, SQL для базових продажів або бухгалтерського обліку, доступ до різних хмар або кількох хмарних служб для розробки програм).
  • Які типи програмного забезпечення є найбільш прийнятними та економічно ефективними для організації?
  • Скільки людей будуть мати доступ до системи одночасно?
  • Скільки відділів і скільки людей у ​​кожному відділі?
  • Чи будуть різні відділи потребувати різного програмного забезпечення?
  • Чи є якісь незвичайні потреби, які слід враховувати? 
  • Скільки даних потрібно буде зберігати?
  • Чи проблема масштабованості?
  • Чи підключатиметься база даних інструменти бізнес -аналітики?
  • Чи потрібні онлайн-аналітичні запити (OLAP), обробка транзакцій (OLTP) чи обидва?
  • Чи буде база даних інтегрована з поточним стеком технологій?
  • Чи потрібно буде змінити формат даних?
  • Яким мовам програмування ви віддаєте перевагу?
  • Чи буде він інтегрований з будь-яким програмним забезпеченням машинного навчання?

Три фази моделювання даних

Моделювання даних стало важливим протягом 1960-х років, коли інформаційні системи управління вперше стали популярними. (До 60-х років фактичне зберігання даних було мало. Комп’ютери того часу були в основному гігантськими калькуляторами.) 

З точки зору концепцій моделювання даних, повністю розроблена модель даних часто складається з трьох етапів: концептуальна модель, логічна модель і фізична модель. Цей процес проектування забезпечує чітке розуміння системи даних і того, як дані проходять через неї. Цей процес також показує, як працюють процедури зберігання, і допомагає гарантувати, що всі об’єкти даних у системі представлені. (Якщо дані — це інформація, яка зберігалася в електронному вигляді, тоді об’єкт даних — це окрема колекція інформації, що зберігається в електронному вигляді, наприклад файл або таблиця даних.)

Концептуальна модель даних зазвичай використовується для опису основних компонентів системи та того, як дані переміщуються системою. The концептуальна модель даних повідомляє, як інформація переходить через один відділ до наступного. Він показує широкі сутності (репрезентації речей, які існують у реальності) та їхні зв’язки (асоціації, які існують між двома чи більше сутностями). Детальна інформація, як правило, опущена.

Логічна модель даних зазвичай фокусується на компонуванні та структурі об’єктів даних у моделі та встановлює зв’язки між ними. Це також забезпечує основу для побудови фізичної моделі. The логічна модель даних додає корисну інформацію до концептуальної моделі.

Фізична модель даних по суті є модель попереднього впровадження і дуже детальний і часто зосереджений на дизайні бази даних. Він показує необхідні деталі для розробки бази даних (але також може бути використаний для реалізації нової частини системи). Ця концепція моделювання даних значно полегшує візуалізацію структури даних шляхом передачі обмежень бази даних, ключів стовпців, тригерів та інших функцій керування даними. Ця модель також передає профілі доступу, авторизації, первинні та зовнішні ключі тощо.

Різні типи моделей даних

Нижче наведено кілька прикладів різних типів моделей даних.

Ієрархічна модель є досить старим і був досить популярним у 1960-х і 70-х роках. Він організовує дані в деревоподібні структури. Сьогодні він використовується переважно для зберігання систем файлів і географічної інформації. В ієрархічна модель, дані організовані у зв’язку «один до багатьох» із файлами даних.

Модель мережі схожа на ієрархічну модель і дозволяє створювати різноманітні зв’язки зі зв’язаними записами. The модель мережі дозволяє людям побудувати модель за допомогою наборів пов’язаних записів. Кожен запис пов’язано з кількома файлами та об’єктами даних, сприяючи та представляючи складні зв’язки.

Модель сутність-зв'язок це графічне представлення файлів даних і сутностей та їхніх зв’язків. Він намагається створити реальні сценарії. Як модель системи даних, модель сутність-зв'язок розробляє набір сутностей, набір зв’язків, атрибути та обмеження. Вони часто використовуються при розробці реляційних баз даних.

Модель даних графа вимагає визначення того, які сутності у вашому наборі даних мають бути призначені вузлами, які мають бути призначеними зв’язками, а які слід відкинути. Модель даних графа надає макет сутностей, властивостей і зв’язків даних. Процес повторюється, заснований на пробах і помилках і може бути виснажливим, але його варто робити правильно.  

Об'єктно-орієнтована модель бази даних фокусується на об'єктах даних, пов'язаних з методами та функціями. Він містить таблиці, але не обов’язково обмежується ними. Дані та їхні зв’язки зберігаються разом як єдине ціле (об’єкт даних). Об’єкти даних представляють сутності реального світу. The об'єктно-орієнтована модель бази даних обробляє різні формати та використовується для досліджень.

Реляційна модель, яку часто називають SQL, наразі є найпопулярнішою моделлю даних. Він використовує двовимірні таблиці для зберігання даних і зв’язків. Усі дані певного типу зберігаються в рядках як частина таблиці. Таблиці представляють зв’язки, а їх об’єднання встановлює зв’язки між збереженими даними. Модель реляційної бази даних це зріла модель, яка підтримується величезною кількістю програмного забезпечення для різних цілей.

Модель даних NoSQL не використовує рядків і стовпців і насправді не використовує жодної структури набору. Їх розробка та дизайн зазвичай зосереджені на створенні фізичних моделей даних. Масштабованість із її специфічними примхами та проблемами викликає серйозне занепокоєння. 

Об'єктно-реляційна модель бази даних поєднує об'єктно-орієнтовану модель бази даних з моделлю реляційної бази даних. Він зберігає об’єкти, класи, успадкування тощо так само, як і об’єктно-орієнтована модель, але також підтримує табличні структури, такі як модель реляційної бази даних. Цей дизайн дозволяє дизайнерам інтегрувати його особливості в структуру столу.

Важливість концепцій моделювання даних

Моделі даних схожі на креслення, але вони визначають зв’язки, сутності та атрибути бази даних або системи даних. Організована та добре спроектована модель даних необхідна для розробки ефективної фізичної бази даних і системи даних. Добре розуміння концепцій моделювання даних потрібне для усунення проблем зі зберіганням і надлишковістю при підтримці ефективного пошуку даних. 

Моделювання даних може бути складним завданням, і важливо розуміти, що кожен тип моделі має свої переваги та недоліки. 

Зображення використовується за ліцензією Shutterstock.com

Часова мітка:

Більше від ПЕРЕДАЧА