Datamodelleringskonsepter for nybegynnere

Datamodelleringskonsepter for nybegynnere

Kilde node: 2623283
datamodelleringskonsepterdatamodelleringskonsepter

Konseptene for datamodellering støtter et helhetlig bilde av hvordan data beveger seg gjennom et system. Datamodellering kan beskrives som prosessen med å designe et datasystem eller en del av et datasystem. Disse modellene kan variere fra lagringssystemer til databaser til hele organisasjonens datastruktur. Datamodeller kan brukes som design for implementering av et nytt system eller som referansemateriale for systemer som allerede er etablert. 

En "komplett" datamodell bør kommunisere hvilke typer data som brukes og lagres i et datasystem, formatene som brukes, relasjonene mellom datafiler og måtene dataene kan grupperes og organiseres på.

Mange virksomheter utvikler unike, individuelle datamodeller (og de resulterende unike, individuelle datasystemene) bygget rundt organisasjonens spesifikke behov og krav. Disse modellene kan brukes til å visualisere databevegelse gjennom systemet. En datamodell kan forsøke å dekke alle aspekter av dataflyten gjennom en organisasjon, eller spesifikke parametere, for eksempel å vise bare salgsdata for forskningsformål.

En godt utformet datamodell vil forklare forretningsregler, samt behovet for overholdelse av regelverk av dataene.

Det er tre faser i datamodelleringsprosessen: den konseptuelle modellen, den logiske modellen og den fysiske modellen. Hver fase, eller trinn i modellens utvikling, tjener et bestemt formål. I tillegg er det flere "typer" modeller.

Visuelle datamodeller ligner på en arkitekts tegninger og kan støttes med koblet tekst for å gi veiledning når du utvikler eller endrer datasystemet. Eksempler på visuelle datamodeller finnes her..

Fordelene og utfordringene ved datamodellering

Å utvikle en datamodell gir et kart og et kommunikasjonsverktøy for å lage eller endre et datasystem. Datamodelleringskonsepter gjør konstruksjonen av et datasystem mye, mye enklere. Den nybygde databasen og/eller datasystemet skal støtte god organisatorisk kommunikasjon. Det bør også støtte sanntidsprosjekter, inkludert innsamling av data om forbruksmønstre, fakturaer og andre forretningsprosesser.

Datamodelleringsprosessen kan brukes til å identifisere Problemer med datakvalitet, inkludert dupliserte, redundante og manglende data.

En vanskelighet med å lage en datamodell er mangel på forståelse av datasystemer – et problem som normalt elimineres ved å bygge modellen. Et annet problem er at en liten endring på ett område kan kreve betydelige endringer på andre områder. I tillegg kan det være lett å bli så fokusert på datasystemets struktur at styrkene og svakhetene til individuelle applikasjoner ignoreres.

Viktige spørsmål å stille

Å utvikle en datamodell begynner med å samle informasjon om organisasjonens behov, krav og mål. En modell av en del av systemet vil kreve færre spørsmål enn å utvikle en modell for et helt nytt system. Noen grunnleggende spørsmål å stille for en modell av en del av systemet er: 

  • Hva er hensikten eller målet med endringene?
  • Hvilke typer data jobber systemet med for øyeblikket?
  • Hvilke data trengs?
  • Hvilke verktøy eller programvare trengs for å nå målet?
  • Er verktøyene eller programvaren kompatible?

En datamodell bør bygges rundt organisasjonens behov og er en viktig faktor for å utvikle en ny modell eller justere en gammel. Spørsmålene som stilles ved utforming av en database, eller et helt nytt system, krever ofte mye mer omfattende svar. Det er best å inkludere en femårig forretningsplan når du svarer på disse spørsmålene: 

  • Hva er virksomhetens mål (forskning, salg, apputvikling, regnskapstjenester)? Dette vil bestemme de beste typene programvare for å støtte virksomheten (NoSQL eller grafikk for forskning, SQL for grunnleggende salg eller regnskap, tilgang til ulike skyer eller flere skytjenester for apputvikling).
  • Hvilke typer programvare er mest hensiktsmessige og kostnadseffektive for organisasjonen?
  • Hvor mange personer vil ha tilgang til systemet samtidig?
  • Hvor mange avdelinger er det, og hvor mange personer er det i hver avdeling?
  • Vil ulike avdelinger kreve ulike typer programvare?
  • Er det noen uvanlige behov som bør vurderes? 
  • Hvor mye data må lagres?
  • Er skalerbarhet et problem?
  • Vil databasen koble seg til business intelligence verktøy?
  • Er online analytiske spørringer (OLAP), transaksjonsbehandling (OLTP) eller begge nødvendig?
  • Vil databasen integreres med den nåværende teknologistabelen?
  • Må dataformatet transformeres?
  • Hva er dine foretrukne programmeringsspråk?
  • Vil den bli integrert med maskinlæringsprogramvare?

De tre faser av datamodellering

Datamodellering ble viktig under 1960s, da ledelsesinformasjonssystemer først ble populære. (Før 60-tallet var det lite i veien for faktisk datalagring. Datamaskiner på den tiden var i utgangspunktet gigantiske kalkulatorer.) 

Når det gjelder datamodelleringskonsepter, bygges en fullt utviklet datamodell ofte i tre faser: den konseptuelle modellen, den logiske modellen og den fysiske modellen. Denne designprosessen gir en klar forståelse av datasystemet og hvordan dataene flyter gjennom det. Denne prosessen viser også hvordan lagringsprosedyrene fungerer og bidrar til å sikre at alle dataobjekter i systemet er representert. (Hvis data er informasjon som er lagret elektronisk, er et dataobjekt en individuell samling av informasjon som er lagret elektronisk, for eksempel en fil eller en datatabell.)

Den konseptuelle datamodellen brukes vanligvis til å beskrive systemets mest grunnleggende komponenter og hvordan dataene beveger seg gjennom systemet. De konseptuell datamodell kommuniserer hvordan informasjon beveger seg gjennom en avdeling og videre til den neste. Den viser brede enheter (representasjoner av ting som eksisterer i virkeligheten) og deres relasjoner (assosiasjoner som eksisterer mellom to eller flere enheter). Detaljert informasjon er generelt utelatt.

Den logiske datamodellen fokuserer normalt på utformingen og strukturen til dataobjekter i modellen og etablerer relasjonene mellom dem. Det gir også et grunnlag for å bygge den fysiske modellen. De logisk datamodell legger nyttig informasjon til den konseptuelle modellen.

Den fysiske datamodellen er egentlig en pre-implementeringsmodell og er veldig detaljert og ofte fokusert på databasedesignet. Den viser de nødvendige detaljene for å utvikle databasen (men kan også brukes til å implementere en ny del av systemet). Dette datamodelleringskonseptet gjør visualisering av datastrukturen mye enklere ved å kommunisere databasebegrensninger, kolonnenøkler, utløsere og andre dataadministrasjonsfunksjoner. Denne modellen kommuniserer også tilgangsprofiler, autorisasjoner, primær- og fremmednøkler, etc.

Ulike typer datamodeller

Nedenfor er noen eksempler på de ulike typene datamodeller.

Den hierarkiske modellen er ganske gammel og var ganske populær på 1960- og 70-tallet. Den organiserer dataene i trelignende strukturer. I dag brukes den først og fremst til lagring av arkivsystemer og geografisk informasjon. I hierarkisk modell, er dataene organisert i en en-til-mange-relasjon med datafilene.

Nettverksmodellen ligner på den hierarkiske modellen og tillater opprettelse av ulike relasjoner med koblede poster. De nettverksmodell lar folk konstruere modellen ved å bruke sett med relaterte poster. Hver post er assosiert med flere filer og dataobjekter, og fremmer og presenterer komplekse relasjoner.

Entitet-relasjonsmodellen er en grafisk representasjon av datafiler og enheter og deres relasjoner. Den prøver å lage scenarier i den virkelige verden. Som en datasystemmodell er enhet-relasjonsmodell utvikler et enhetssett, et relasjonssett, attributter og begrensninger. De brukes ofte til å designe relasjonsdatabaser.

Grafdatamodellen krever at du bestemmer hvilke enheter i datasettet som skal utpekes noder, hvilke som skal være utpekte koblinger, og hvilke som skal forkastes. Grafdatamodellen gir et oppsett av dataenes enheter, egenskaper og relasjoner. Prosessen er repeterende, er avhengig av prøving og feiling, og kan være kjedelig, men er verdt å gjøre riktig.  

Den objektorienterte databasemodellen fokuserer på dataobjekter knyttet til metoder og funksjoner. Den inneholder tabeller, men er ikke nødvendigvis begrenset til tabeller. Data og deres relasjoner lagres sammen som en enkelt enhet (et dataobjekt). Dataobjekter representerer virkelige enheter. De objektorientert databasemodell håndterer en rekke formater og brukes til forskning.

Den relasjonelle modellen, ofte referert til som SQL, er for tiden den mest populære datamodellen. Den bruker todimensjonale tabeller for å lagre data og kommunisere relasjoner. Alle data av en bestemt type lagres i rader som en del av en tabell. Tabellene representerer relasjoner, og sammenføyning med dem etablerer relasjonene mellom de lagrede dataene. Relasjonsdatabasemodellen er en moden modell som støttes av en enorm mengde programvare for en rekke formål.

NoSQL-datamodellen bruker ikke rader og kolonner og bruker egentlig ikke noen form for settstruktur. Deres utvikling og design er vanligvis fokusert på å lage fysiske datamodeller. Skalerbarhet, med sine spesifikke særheter og problemer, er en betydelig bekymring. 

En objektrelasjonell databasemodell kombinerer den objektorienterte databasemodellen med relasjonsdatabasemodellen. Den lagrer objekter, klasser, arv, etc., på samme måte som en objektorientert modell, men støtter også tabellstrukturer som relasjonsdatabasemodellen. Dette designet lar designere inkorporere funksjonene i en tabellstruktur.

Viktigheten av datamodelleringskonsepter

Datamodeller er som tegninger, men de definerer relasjonene, enhetene og attributtene til en database eller et datasystem. En organisert og godt utformet datamodell er nødvendig for å utvikle en effektiv fysisk database og datasystem. En god forståelse av datamodelleringskonsepter er nødvendig for å eliminere lagringsproblemer og redundansproblemer og samtidig støtte effektiv datainnhenting. 

Datamodellering kan være en utfordring, og det er viktig å erkjenne at hver type modell har sine egne fordeler og ulemper. 

Bildet brukes under lisens fra Shutterstock.com

Tidstempel:

Mer fra DATAVERSITET