Adatmodellezési koncepciók kezdőknek

Adatmodellezési koncepciók kezdőknek

Forrás csomópont: 2623283
adatmodellezési fogalmakadatmodellezési fogalmak

Az adatmodellezés koncepciói támogatják az adatok rendszeren keresztüli mozgásának holisztikus képét. Az adatmodellezés egy adatrendszer vagy egy adatrendszer egy részének tervezési folyamataként írható le. Ezek a modellek a tárolórendszerektől az adatbázisokon át a szervezet teljes adatstruktúrájáig terjedhetnek. Az adatmodellek használhatók tervezésként egy új rendszer megvalósításához, vagy referenciaanyagként a már létrehozott rendszerek számára. 

A „teljes” adatmodellnek közölnie kell az adatrendszerben használt és tárolt adatok típusait, a használt formátumokat, az adatfájlok közötti kapcsolatokat, valamint az adatok csoportosításának és rendszerezésének módjait.

Sok vállalkozás egyedi, egyedi adatmodelleket (és az ebből eredő egyedi, egyedi adatrendszereket) fejleszt ki a szervezet sajátos igényei és követelményei köré. Ezek a modellek használhatók az adatok rendszeren keresztüli mozgásának megjelenítésére. Az adatmodell megkísérelheti lefedni a szervezeten keresztüli adatáramlás minden aspektusát, vagy meghatározott paramétereket, például csak az értékesítési adatokat jelenítheti meg kutatási célból.

Egy jól megtervezett adatmodell megmagyarázza a üzleti szabályok, valamint annak szükségessége előírásoknak való megfelelés az adatok.

Az adatmodellezési folyamatnak három fázisa van: a fogalmi modell, a logikai modell és a fizikai modell. A modell fejlesztésének minden fázisa vagy szakasza meghatározott célt szolgál. Ezenkívül számos „típus” létezik.

A vizuális adatmodellek hasonlóak az építészek tervrajzaihoz, és linkelt szöveggel támogathatók, hogy útmutatást nyújtsanak az adatrendszer fejlesztése vagy módosítása során. Példák vizuális adatmodellekre találhatók itt.

Az adatmodellezés előnyei és kihívásai

Az adatmodell fejlesztése térképet és kommunikációs eszközt biztosít az adatrendszer létrehozásához vagy módosításához. Az adatmodellezési koncepciók sokkal, de sokkal könnyebbé teszik az adatrendszer felépítését. Az újonnan épített adatbázisnak és/vagy adatrendszernek támogatnia kell a jó szervezeti kommunikációt. Támogatnia kell a valós idejű projekteket is, beleértve a költési mintákról, számlákról és egyéb üzleti folyamatokról való adatgyűjtést.

Az adatmodellezési folyamat segítségével azonosítani lehet Adatminőségi problémák, beleértve a duplikált, redundáns és hiányzó adatokat.

Az adatmodell létrehozásának egyik nehézsége az adatrendszerek megértésének hiánya – ez a probléma általában a modell felépítésével kiküszöbölhető. További probléma, hogy egy területen egy kis változtatás jelentős változtatásokat igényelhet más területeken is. Ezen túlmenően könnyen lehet, hogy annyira az adatrendszer szerkezetére koncentrálunk, hogy figyelmen kívül hagyjuk az egyes alkalmazások erősségeit és gyengeségeit.

Fontos kérdések

Az adatmodell fejlesztése a szervezet szükségleteiről, követelményeiről és céljairól szóló információk gyűjtésével kezdődik. A rendszer egy részének modellje kevesebb kérdést fog feltenni, mint egy teljesen új rendszer modelljének kidolgozása. Néhány alapvető kérdés, amelyet fel kell tenni a rendszer egy részének modelljéhez: 

  • Mi a változtatások célja vagy célja?
  • Milyen típusú adatokkal dolgozik jelenleg a rendszer?
  • Milyen adatokra van szükség?
  • Milyen eszközökre, szoftverekre van szükség a cél eléréséhez?
  • Az eszközök vagy szoftverek kompatibilisek?

Az adatmodellt a szervezet szükségletei köré kell építeni, és ez fontos tényező egy új modell kidolgozásában vagy egy régi módosításában. Az adatbázis, vagy egy teljesen új rendszer tervezése során feltett kérdések gyakran sokkal kiterjedtebb válaszokat igényelnek. A legjobb, ha ötéves üzleti tervet épít be, amikor megválaszolja ezeket a kérdéseket: 

  • Melyek a vállalkozás céljai (kutatás, értékesítés, alkalmazásfejlesztés, számviteli szolgáltatások)? Ez határozza meg a legjobb szoftvertípusokat az üzlet támogatásához (NoSQL vagy grafika kutatáshoz, SQL alapvető értékesítéshez vagy könyveléshez, hozzáférés különböző felhőkhoz vagy több felhőszolgáltatáshoz az alkalmazások fejlesztéséhez).
  • Milyen típusú szoftverek a legmegfelelőbbek és a legköltséghatékonyabbak a szervezet számára?
  • Hány ember fér hozzá egyszerre a rendszerhez?
  • Hány osztály van, és hány fő van az egyes osztályokon?
  • A különböző részlegeknek különböző szoftverekre lesz szükségük?
  • Vannak szokatlan igények, amelyeket figyelembe kell venni? 
  • Mennyi adatot kell majd tárolni?
  • A skálázhatóság probléma?
  • Kapcsolódni fog az adatbázis üzleti intelligencia eszközök?
  • Szükség van-e online analitikus lekérdezésekre (OLAP), tranzakciófeldolgozásra (OLTP), vagy mindkettőre?
  • Integrálni fog az adatbázist a jelenlegi technológiai verembe?
  • Átalakítani kell az adatok formátumát?
  • Melyek a preferált programozási nyelvek?
  • Integrálva lesz bármilyen gépi tanulási szoftverrel?

Az adatmodellezés három fázisa

Az adatmodellezés fontossá vált az 1960-as években, amikor a vezetői információs rendszerek először váltak népszerűvé. (A '60-as évek előtt kevés volt a tényleges adattárolás. Az akkori számítógépek alapvetően óriási számológépek voltak.) 

Ami az adatmodellezési koncepciókat illeti, a teljesen kidolgozott adatmodellt gyakran három fázisban építik fel: a koncepcionális modellből, a logikai modellből és a fizikai modellből. Ez a tervezési folyamat világos megértést biztosít az adatrendszerről és arról, hogy az adatok hogyan áramlanak át rajta. Ez a folyamat azt is bemutatja, hogy a tárolási eljárások hogyan működnek, és segít biztosítani, hogy a rendszerben lévő összes adatobjektum megjelenítve legyen. (Ha az adat elektronikusan tárolt információ, akkor az adatobjektum az elektronikusan tárolt információk egyedi gyűjteménye, például fájl vagy adattábla.)

A fogalmi adatmodell jellemzően a rendszer legalapvetőbb összetevőinek leírására szolgál, valamint azt, hogy az adatok hogyan mozognak a rendszerben. A fogalmi adatmodell közli, hogy az információ hogyan halad át az egyik részlegen és tovább a másik felé. Megmutatja a tág entitásokat (a valóságban létező dolgok reprezentációit) és azok kapcsolatait (két vagy több entitás között létező asszociációkat). A részletes információkat általában kihagyják.

A logikai adatmodell általában a modellen belüli adatobjektumok elrendezésére és szerkezetére összpontosít, és létrehozza a köztük lévő kapcsolatokat. Ez alapot ad a fizikai modell felépítéséhez is. A logikai adatmodell hasznos információkkal egészíti ki a fogalmi modellt.

A fizikai adatmodell lényegében a végrehajtás előtti modell és nagyon részletes, és gyakran az adatbázis tervezésére összpontosít. Megmutatja az adatbázis fejlesztéséhez szükséges részleteket (de használható a rendszer új részének megvalósítására is). Ez az adatmodellezési koncepció nagyban megkönnyíti az adatstruktúra megjelenítését az adatbázis-kényszerek, oszlopkulcsok, triggerek és egyéb adatkezelési szolgáltatások kommunikálásával. Ez a modell hozzáférési profilokat, jogosultságokat, elsődleges és idegen kulcsokat stb. is közöl.

Különböző típusú adatmodellek

Az alábbiakban néhány példa látható a különböző típusú adatmodellekre.

A hierarchikus modell meglehetősen régi, és meglehetősen népszerű volt az 1960-as és 70-es években. Az adatokat faszerű struktúrákba rendezi. Ma elsősorban iratrendszerek és földrajzi információk tárolására használják. Ban,-ben hierarchikus modell, az adatok egy-a-többhöz viszonyba vannak rendezve az adatfájlokkal.

A hálózati modell hasonló a hierarchikus modellhez, és lehetővé teszi különféle kapcsolatok létrehozását a csatolt rekordokkal. A hálózati modell lehetővé teszi az emberek számára, hogy a kapcsolódó rekordok készletei segítségével hozzák létre a modellt. Minden rekord több fájlhoz és adatobjektumhoz van társítva, elősegítve és bemutatva az összetett kapcsolatokat.

Az entitás-kapcsolat modell az adatfájlok és entitások, valamint kapcsolataik grafikus ábrázolása. Megpróbál valós forgatókönyveket létrehozni. Adatrendszer-modellként a entitás-kapcsolat modell entitáskészletet, kapcsolatkészletet, attribútumokat és megszorításokat fejleszt ki. Gyakran használják relációs adatbázisok tervezésénél.

A grafikon adatmodell megköveteli annak meghatározását, hogy az adatkészleten belül mely entitások legyenek csomópontok, melyek legyenek hivatkozások, és melyeket kell elvetni. A grafikon adatmodell az adatok entitásainak, tulajdonságainak és kapcsolatainak elrendezését biztosítja. A folyamat ismétlődő, próbálkozásokon és hibákon alapul, és fárasztó is lehet, de érdemes jól csinálni.  

Az objektum-orientált adatbázis modell a metódusokhoz és szolgáltatásokhoz társított adatobjektumokra összpontosít. Tartalmaz táblázatokat, de nem feltétlenül korlátozódik a táblázatokra. Az adatokat és kapcsolatait egyetlen entitásként (adatobjektumként) tárolják. Az adatobjektumok valós entitásokat képviselnek. A objektum-orientált adatbázis-modell sokféle formátumot kezel, és kutatásra használják.

A relációs modell, amelyet gyakran SQL-nek neveznek, jelenleg a legnépszerűbb adatmodell. Kétdimenziós táblákat használ az adatok tárolására és a kapcsolatok kommunikációjára. Egy adott típusú minden adatot sorokban tárolunk egy táblázat részeként. A táblák kapcsolatokat ábrázolnak, ezek összekapcsolása pedig a tárolt adatok közötti kapcsolatokat hozza létre. A relációs adatbázis modell egy kiforrott modell, amelyet hatalmas mennyiségű szoftver támogat különféle célokra.

A NoSQL adatmodell nem használ sorokat és oszlopokat, és nem igazán használ semmiféle halmazstruktúrát. Fejlesztésük és kialakításuk jellemzően fizikai adatmodellek létrehozására összpontosítanak. A méretezhetőség, annak sajátos furcsaságaival és problémáival, jelentős aggodalomra ad okot. 

Objektum-relációs adatbázismodell egyesíti az objektum-orientált adatbázis-modellt a relációs adatbázis-modellel. Tárolja az objektumokat, osztályokat, öröklődést stb., ugyanúgy, mint egy objektumorientált modell, de támogatja a táblázatos struktúrákat is, például a relációs adatbázis-modellt. Ez a design lehetővé teszi a tervezők számára, hogy jellemzőit beépítsék egy táblázatszerkezetbe.

Az adatmodellezési fogalmak jelentősége

Az adatmodellek olyanok, mint a tervrajzok, de meghatározzák egy adatbázis vagy adatrendszer kapcsolatait, entitásait és attribútumait. A hatékony fizikai adatbázis és adatrendszer kialakításához szervezett és jól megtervezett adatmodell szükséges. Az adatmodellezési koncepciók alapos ismerete szükséges a tárolási problémák és a redundanciaproblémák kiküszöböléséhez, miközben támogatja a hatékony adatvisszakeresést. 

Az adatmodellezés kihívást jelenthet, és fontos felismerni, hogy minden modelltípusnak megvannak a maga előnyei és hátrányai. 

A kép a Shutterstock.com licence alapján lett felhasználva

Időbélyeg:

Még több ADATVERZITÁS