Datamodelleringskoncepter for begyndere

Genudgivet af Platon

Abonnenter: 0

Koncepterne for datamodellering understøtter et holistisk billede af, hvordan data bevæger sig gennem et system. Datamodellering kan beskrives som processen med at designe et datasystem eller en del af et datasystem. Disse modeller kan spænde fra lagersystemer til databaser til hele organisationens datastruktur. Datamodeller kan bruges som design til implementering af et nyt system eller som referencemateriale for allerede etablerede systemer.

En "komplet" datamodel bør kommunikere de typer data, der bruges og lagres i et datasystem, de anvendte formater, relationerne mellem datafiler og måderne, hvorpå dataene kan grupperes og organiseres.

Mange virksomheder udvikler unikke, individuelle datamodeller (og de resulterende unikke, individuelle datasystemer) bygget op omkring organisationens specifikke behov og krav. Disse modeller kan bruges til at visualisere databevægelse gennem systemet. En datamodel kan forsøge at dække alle aspekter af datastrømmen gennem en organisation eller specifikke parametre, såsom kun at vise salgsdata til forskningsformål.

En veldesignet datamodel vil forklare forretningsregler, samt behovet for lovgivningsmæssig overholdelse af dataene.

Der er tre faser i datamodelleringsprocessen: den konceptuelle model, den logiske model og den fysiske model. Hver fase, eller fase af modellens udvikling, tjener et bestemt formål. Derudover er der flere "typer" af modeller.

Visuelle datamodeller ligner en arkitekts tegninger og kan understøttes med linket tekst for at give vejledning ved udvikling eller ændring af datasystemet. Eksempler på visuelle datamodeller kan findes link..

Fordelene og udfordringerne ved datamodellering

Udvikling af en datamodel giver et kort og et kommunikationsværktøj til oprettelse eller ændring af et datasystem. Datamodelleringskoncepter gør konstruktionen af et datasystem meget, meget lettere. Den nybyggede database og/eller datasystemet skal understøtte god organisatorisk kommunikation. Det bør også understøtte realtidsprojekter, herunder indsamling af data om forbrugsmønstre, fakturaer og andre forretningsprocesser.

Datamodelleringsprocessen kan bruges til at identificere Problemer med datakvalitet, herunder duplikerede, redundante og manglende data.

En vanskelighed ved at skabe en datamodel er manglende forståelse af datasystemer – et problem, der normalt elimineres ved at bygge modellen. Et andet problem er, at en lille ændring på et område kan kræve væsentlige ændringer på andre områder. Derudover kan det være nemt at blive så fokuseret på datasystemets struktur, at styrker og svagheder ved individuelle applikationer ignoreres.

Vigtige spørgsmål at stille

Udvikling af en datamodel begynder med indsamling af information om organisationens behov, krav og mål. En model af en del af systemet vil kræve færre spørgsmål end at udvikle en model for et helt nyt system. Nogle grundlæggende spørgsmål at stille til en model af en del af systemet er:

Hvad er formålet eller målet med ændringerne?
Hvilke typer data arbejder systemet med i øjeblikket?
Hvilke data er nødvendige?
Hvilke værktøjer eller software er nødvendige for at nå målet?
Er værktøjerne eller softwaren kompatible?

En datamodel bør bygges op omkring organisationens behov og er en vigtig faktor i at udvikle en ny model eller justere en gammel. Spørgsmålene, der stilles ved design af en database eller et helt nyt system, kræver ofte meget mere omfattende svar. Det er bedst at indarbejde en femårig forretningsplan, når du besvarer disse spørgsmål:

Hvad er virksomhedens mål (forskning, salg, apps udvikling, regnskabstjenester)? Dette vil bestemme de bedste typer software til at understøtte virksomheden (NoSQL eller grafik til forskning, SQL til grundlæggende salg eller regnskab, adgang til forskellige skyer eller flere cloud-tjenester til apps-udvikling).
Hvilke typer software er mest passende og omkostningseffektive for organisationen?
Hvor mange personer vil have adgang til systemet samtidigt?
Hvor mange afdelinger er der, og hvor mange personer er der i hver afdeling?
Vil forskellige afdelinger kræve forskellige former for software?
Er der nogle usædvanlige behov, der bør tages i betragtning?
Hvor meget data skal der gemmes?
Er skalerbarhed et problem?
Vil databasen oprette forbindelse til business intelligence -værktøjer?
Er online analytiske forespørgsler (OLAP), transaktionsbehandling (OLTP) eller begge nødvendige?
Vil databasen integreres med den aktuelle teknologistack?
Skal dataformatet transformeres?
Hvad er dine foretrukne programmeringssprog?
Vil det blive integreret med nogen maskinlæringssoftware?

De tre faser af datamodellering

Datamodellering blev vigtig i løbet af 1960'erne, da ledelsesinformationssystemer først blev populære. (Før 60'erne var der lidt i vejen for egentlig datalagring. Computere fra den tid var dybest set gigantiske lommeregnere.)

Med hensyn til datamodelleringskoncepter er en fuldt udviklet datamodel ofte bygget i tre faser: den konceptuelle model, den logiske model og den fysiske model. Denne designproces giver en klar forståelse af datasystemet og hvordan data flyder igennem det. Denne proces viser også, hvordan lagringsprocedurerne fungerer og er med til at sikre, at alle dataobjekter i systemet er repræsenteret. (Hvis data er information, der er blevet lagret elektronisk, så er et dataobjekt en individuel samling af information, der er lagret elektronisk, såsom en fil eller en datatabel.)

Den konceptuelle datamodel bruges typisk til at beskrive systemets mest basale komponenter og hvordan data bevæger sig gennem systemet. Det konceptuel datamodel kommunikerer, hvordan information bevæger sig gennem én afdeling og videre til den næste. Den viser brede entiteter (repræsentationer af ting, der eksisterer i virkeligheden) og deres relationer (associationer, der eksisterer mellem to eller flere entiteter). Detaljerede oplysninger er generelt udeladt.

Den logiske datamodel fokuserer normalt på layout og struktur af dataobjekter i modellen og etablerer relationerne mellem dem. Det giver også et grundlag for at bygge den fysiske model. Det logisk datamodel tilføjer nyttig information til den konceptuelle model.

Den fysiske datamodel er i det væsentlige en præ-implementeringsmodel og er meget detaljeret og ofte fokuseret på databasedesignet. Den viser de nødvendige detaljer til udvikling af databasen (men kan også bruges til at implementere en ny del af systemet). Dette datamodelleringskoncept gør det meget nemmere at visualisere datastrukturen ved at kommunikere databasebegrænsninger, kolonnenøgler, triggere og andre datastyringsfunktioner. Denne model kommunikerer også adgangsprofiler, autorisationer, primære og fremmede nøgler osv.

Forskellige typer datamodeller

Nedenfor er nogle eksempler på de forskellige typer af datamodeller.

Den hierarkiske model er ret gammel og var ret populær i 1960'erne og 70'erne. Det organiserer dataene i trælignende strukturer. I dag bruges det primært til lagring af arkivsystemer og geografisk information. I den hierarkisk model, er dataene organiseret i et en-til-mange forhold med datafilerne.

Netværksmodellen ligner den hierarkiske model og tillader oprettelsen af forskellige relationer med forbundne poster. Det netværksmodel giver folk mulighed for at konstruere modellen ved hjælp af sæt af relaterede optegnelser. Hver post er forbundet med flere filer og dataobjekter, hvilket fremmer og præsenterer komplekse relationer.

Entitet-relationsmodellen er en grafisk repræsentation af datafiler og entiteter og deres relationer. Det forsøger at skabe scenarier i den virkelige verden. Som en datasystemmodel er enhedsforholdsmodel udvikler et enhedssæt, et relationssæt, attributter og begrænsninger. De bruges ofte til at designe relationelle databaser.

Grafdatamodellen kræver, at det bestemmes, hvilke entiteter i dit datasæt der skal udpeges noder, hvilke der skal udpeges som links, og hvilke der skal kasseres. Grafdatamodellen giver et layout af dataens entiteter, egenskaber og relationer. Processen er gentagen, er afhængig af forsøg og fejl og kan være trættende, men det er værd at gøre rigtigt.

Den objektorienterede databasemodel fokuserer på dataobjekter forbundet med metoder og funktioner. Den indeholder tabeller, men er ikke nødvendigvis begrænset til tabeller. Data og deres relationer gemmes sammen som en enkelt enhed (et dataobjekt). Dataobjekter repræsenterer enheder i den virkelige verden. Det objektorienteret databasemodel håndterer en række forskellige formater og bruges til forskning.

Den relationelle model, ofte omtalt som SQL, er i øjeblikket den mest populære datamodel. Den bruger todimensionelle tabeller til lagring af data og kommunikation af relationer. Alle data af en bestemt type gemmes i rækker som en del af en tabel. Tabellerne repræsenterer relationer, og sammenføjning af dem etablerer relationerne mellem de lagrede data. Den relationelle databasemodel er en moden model understøttet af en enorm mængde software til en række forskellige formål.

NoSQL-datamodellen bruger ikke rækker og kolonner og bruger ikke rigtig nogen form for en fast struktur. Deres udvikling og design er typisk fokuseret på at skabe fysiske datamodeller. Skalerbarhed, med dens specifikke særheder og problemer, er en væsentlig bekymring.

En objektrelationel databasemodel kombinerer den objektorienterede databasemodel med den relationelle database Model. Den gemmer objekter, klasser, arv osv. på samme måde som en objektorienteret model, men understøtter også tabelstrukturer som den relationelle databasemodel. Dette design giver designere mulighed for at inkorporere dens funktioner i en tabelstruktur.

Vigtigheden af datamodelleringskoncepter

Datamodeller er som tegninger, men de definerer relationerne, entiteterne og attributterne for en database eller et datasystem. En organiseret og veldesignet datamodel er nødvendig for at udvikle en effektiv fysisk database og datasystem. En god forståelse af datamodelleringskoncepter er nødvendig for at eliminere lagringsproblemer og redundansproblemer og samtidig understøtte effektiv datahentning.

Datamodellering kan være en udfordring, og det er vigtigt at erkende, at hver type model kommer med sine egne fordele og ulemper.

Billede brugt under licens fra Shutterstock.com