Koncepcje modelowania danych dla początkujących

Koncepcje modelowania danych dla początkujących

Węzeł źródłowy: 2623283
koncepcje modelowania danychkoncepcje modelowania danych

Koncepcje modelowania danych wspierają całościowy obraz tego, jak dane przepływają przez system. Modelowanie danych można opisać jako proces projektowania systemu danych lub części systemu danych. Modele te mogą obejmować zarówno systemy pamięci masowej, bazy danych, jak i całą strukturę danych organizacji. Modele danych mogą być wykorzystywane jako projekt do wdrożenia nowego systemu lub jako materiał odniesienia dla systemów, które zostały już ustanowione. 

„Kompletny” model danych powinien informować o typach danych, które są używane i przechowywane w systemie danych, używanych formatach, relacjach między plikami danych oraz sposobach grupowania i organizowania danych.

Wiele firm opracowuje unikalne, indywidualne modele danych (i wynikające z nich unikalne, indywidualne systemy danych) zbudowane wokół specyficznych potrzeb i wymagań organizacji. Modele te mogą służyć do wizualizacji ruchu danych w systemie. Model danych może obejmować wszystkie aspekty przepływu danych przez organizację lub określone parametry, takie jak pokazywanie tylko danych dotyczących sprzedaży do celów badawczych.

Dobrze zaprojektowany model danych wyjaśni zasady biznesowe, a także potrzebę zgodność z przepisami danych.

Proces modelowania danych składa się z trzech faz: modelu koncepcyjnego, modelu logicznego i modelu fizycznego. Każda faza lub etap rozwoju modelu służy określonemu celowi. Dodatkowo istnieje kilka „rodzajów” modeli.

Wizualne modele danych są podobne do planów architekta i mogą być wspierane połączonym tekstem, aby zapewnić wskazówki podczas opracowywania lub modyfikowania systemu danych. Można znaleźć przykłady wizualnych modeli danych tutaj.

Korzyści i wyzwania związane z modelowaniem danych

Opracowanie modelu danych zapewnia mapę i narzędzie komunikacyjne do tworzenia lub modyfikowania systemu danych. Koncepcje modelowania danych znacznie ułatwiają budowę systemu danych. Nowo zbudowana baza danych i/lub system danych powinny wspierać dobrą komunikację organizacyjną. Powinien również wspierać projekty w czasie rzeczywistym, w tym zbierać dane o wzorcach wydatków, fakturach i innych procesach biznesowych.

Do identyfikacji można wykorzystać proces modelowania danych Kwestie jakości danych, w tym zduplikowane, nadmiarowe i brakujące dane.

Jedną z trudności w tworzeniu modelu danych jest brak zrozumienia systemów danych – problem zwykle eliminowany podczas budowania modelu. Innym problemem jest to, że niewielka zmiana w jednym obszarze może wymagać znacznych zmian w innych obszarach. Ponadto łatwo jest tak bardzo skoncentrować się na strukturze systemu danych, że ignoruje się mocne i słabe strony poszczególnych aplikacji.

Ważne pytania, które należy zadać

Tworzenie modelu danych rozpoczyna się od zebrania informacji o potrzebach, wymaganiach i celach organizacji. Model części systemu będzie wymagał mniej pytań niż opracowanie modelu dla całkowicie nowego systemu. Niektóre podstawowe pytania, które należy zadać, aby uzyskać model części systemu, to: 

  • Jaki jest cel lub cel zmian?
  • Z jakimi typami danych pracuje obecnie system?
  • Jakie dane są potrzebne?
  • Jakie narzędzia lub oprogramowanie są potrzebne do osiągnięcia celu?
  • Czy narzędzia lub oprogramowanie są kompatybilne?

Model danych powinien być zbudowany wokół potrzeb organizacji i jest ważnym czynnikiem przy opracowywaniu nowego modelu lub dostosowywaniu starego. Pytania zadawane podczas projektowania bazy danych lub zupełnie nowego systemu często wymagają dużo szerszych odpowiedzi. Odpowiadając na te pytania, najlepiej jest uwzględnić pięcioletni biznesplan: 

  • Jakie są cele firmy (badania, sprzedaż, tworzenie aplikacji, usługi księgowe)? To określi najlepsze typy oprogramowania do wspierania biznesu (NoSQL lub grafika do badań, SQL do podstawowej sprzedaży lub księgowości, dostęp do różnych chmur lub kilku usług w chmurze do tworzenia aplikacji).
  • Jakie rodzaje oprogramowania są najbardziej odpowiednie i opłacalne dla organizacji?
  • Ile osób będzie miało jednocześnie dostęp do systemu?
  • Ile jest działów i ile osób pracuje w każdym dziale?
  • Czy różne działy będą wymagać różnego rodzaju oprogramowania?
  • Czy są jakieś nietypowe potrzeby, które należy wziąć pod uwagę? 
  • Ile danych trzeba będzie przechowywać?
  • Czy skalowalność jest problemem?
  • Czy baza danych połączy się z narzędzia do analizy biznesowej?
  • Czy potrzebne są zapytania analityczne online (OLAP), przetwarzanie transakcji (OLTP) lub jedno i drugie?
  • Czy baza danych zintegruje się z obecnym stosem technologicznym?
  • Czy format danych będzie wymagał transformacji?
  • Jakie są twoje preferowane języki programowania?
  • Czy będzie zintegrowany z dowolnym oprogramowaniem do uczenia maszynowego?

Trzy fazy modelowania danych

Modelowanie danych stało się ważne w latach dwudziestych, gdy systemy informacji zarządczej stawały się po raz pierwszy popularne. (Przed latami 60. niewiele było możliwości rzeczywistego przechowywania danych. Komputery tamtych czasów były w zasadzie gigantycznymi kalkulatorami). 

Jeśli chodzi o koncepcje modelowania danych, w pełni rozwinięty model danych jest często budowany w trzech fazach: model koncepcyjny, model logiczny i model fizyczny. Ten proces projektowania zapewnia jasne zrozumienie systemu danych i sposobu, w jaki dane przez niego przepływają. Ten proces pokazuje również, jak działają procedury przechowywania i pomaga zapewnić, że wszystkie obiekty danych w systemie są reprezentowane. (Jeżeli dane to informacje przechowywane elektronicznie, to obiekt danych to indywidualny zbiór informacji przechowywanych elektronicznie, taki jak plik lub tabela danych).

Konceptualny model danych jest zwykle używany do opisywania najbardziej podstawowych komponentów systemu i sposobu, w jaki dane przepływają przez system. The koncepcyjny model danych komunikuje, w jaki sposób informacje przechodzą przez jeden dział i do następnego. Pokazuje szerokie byty (reprezentacje rzeczy, które istnieją w rzeczywistości) i ich relacje (powiązania istniejące między dwoma lub więcej bytami). Szczegółowe informacje są na ogół pomijane.

Logiczny model danych zwykle koncentruje się na układzie i strukturze obiektów danych w modelu i ustanawia relacje między nimi. Stanowi również podstawę do budowy modelu fizycznego. The logiczny model danych dodaje przydatne informacje do modelu koncepcyjnego.

Fizyczny model danych jest zasadniczo model przedwdrożeniowy i jest bardzo szczegółowy i często koncentruje się na projekcie bazy danych. Pokazuje niezbędne szczegóły do ​​rozbudowy bazy danych (ale może być również wykorzystany do wdrożenia nowej części systemu). Ta koncepcja modelowania danych znacznie ułatwia wizualizację struktury danych, komunikując ograniczenia bazy danych, klucze kolumn, wyzwalacze i inne funkcje zarządzania danymi. Model ten komunikuje również profile dostępu, autoryzacje, klucze podstawowe i obce itp.

Różne typy modeli danych

Poniżej przedstawiono kilka przykładów różnych typów modeli danych.

Model hierarchiczny jest dość stary i był dość popularny w latach 1960. i 70. Organizuje dane w struktury drzewiaste. Obecnie służy głównie do przechowywania systemów archiwizacji i informacji geograficznych. w model hierarchiczny, dane są zorganizowane w relacji jeden do wielu z plikami danych.

Model sieciowy jest podobny do modelu hierarchicznego i pozwala na tworzenie różnych relacji z połączonymi rekordami. The model sieciowy pozwala ludziom konstruować model przy użyciu zestawów powiązanych rekordów. Każdy rekord jest powiązany z wieloma plikami i obiektami danych, promując i prezentując złożone relacje.

Model relacji encja jest graficzną reprezentacją plików danych i jednostek oraz ich relacji. Próbuje tworzyć scenariusze z prawdziwego świata. Jako model systemu danych, model relacji podmiot-relacja rozwija zestaw jednostek, zestaw relacji, atrybuty i ograniczenia. Są one często wykorzystywane przy projektowaniu relacyjnych baz danych.

Grafowy model danych wymaga określenia, które jednostki w twoim zbiorze danych powinny być wyznaczone jako węzły, które powinny być wyznaczone jako łącza, a które powinny zostać odrzucone. Grafowy model danych zapewnia układ jednostek, właściwości i relacji danych. Proces ten jest powtarzalny, opiera się na próbach i błędach i może być żmudny, ale warto go wykonywać właściwie.  

Obiektowy model bazy danych koncentruje się na obiektach danych powiązanych z metodami i funkcjami. Zawiera tabele, ale niekoniecznie ogranicza się do tabel. Dane i ich relacje są przechowywane razem jako pojedyncza jednostka (obiekt danych). Obiekty danych reprezentują byty ze świata rzeczywistego. The obiektowy model bazy danych obsługuje różne formaty i jest używany do badań.

Model relacyjny, często określany jako SQL, jest obecnie najpopularniejszym modelem danych. Wykorzystuje dwuwymiarowe tabele do przechowywania danych i komunikowania relacji. Wszystkie dane określonego typu są przechowywane w wierszach jako część tabeli. Tabele reprezentują relacje, a ich połączenie ustanawia relacje między przechowywanymi danymi. Model relacyjnej bazy danych to dojrzały model obsługiwany przez ogromną ilość oprogramowania do różnych celów.

Model danych NoSQL nie używa wierszy i kolumn i tak naprawdę nie używa żadnej struktury zestawu. Ich rozwój i projektowanie zazwyczaj koncentrują się na tworzeniu fizycznych modeli danych. Skalowalność, z jej specyficznymi dziwactwami i problemami, jest poważnym problemem. 

Obiektowo-relacyjny model bazy danych łączy obiektowy model bazy danych z modelem relacyjnej bazy danych. Przechowuje obiekty, klasy, dziedziczenie itp. W taki sam sposób, jak model obiektowy, ale obsługuje również struktury tabelaryczne, takie jak model relacyjnej bazy danych. Ten projekt pozwala projektantom na włączenie jego funkcji do struktury stołu.

Znaczenie koncepcji modelowania danych

Modele danych przypominają schematy, ale definiują relacje, jednostki i atrybuty bazy danych lub systemu danych. Zorganizowany i dobrze zaprojektowany model danych jest niezbędny do opracowania wydajnej fizycznej bazy danych i systemu danych. Dobre zrozumienie koncepcji modelowania danych jest potrzebne do wyeliminowania problemów z pamięcią masową i problemów z redundancją przy jednoczesnym wspieraniu wydajnego wyszukiwania danych. 

Modelowanie danych może być wyzwaniem i ważne jest, aby zdawać sobie sprawę, że każdy typ modelu ma swoje zalety i wady. 

Obraz używany na licencji Shutterstock.com

Znak czasu:

Więcej z WSZECHSTRONNOŚĆ DANYCH