Datamodelleringskoncept för nybörjare

Datamodelleringskoncept för nybörjare

Källnod: 2623283
datamodelleringskonceptdatamodelleringskoncept

Koncepten för datamodellering stödjer en holistisk bild av hur data rör sig genom ett system. Datamodellering kan beskrivas som processen att designa ett datasystem eller en del av ett datasystem. Dessa modeller kan sträcka sig från lagringssystem till databaser till hela organisationens datastruktur. Datamodeller kan användas som design för att implementera ett nytt system eller som referensmaterial för redan etablerade system. 

En "komplett" datamodell bör kommunicera de typer av data som används och lagras i ett datasystem, de format som används, relationerna mellan datafiler och hur data kan grupperas och organiseras.

Många företag utvecklar unika, individuella datamodeller (och de resulterande unika, individuella datasystemen) byggda kring organisationens specifika behov och krav. Dessa modeller kan användas för att visualisera datarörelser genom systemet. En datamodell kan försöka täcka alla aspekter av dataflödet genom en organisation, eller specifika parametrar, som att endast visa försäljningsdata för forskningsändamål.

En väl utformad datamodell kommer att förklara affärsregler, samt behovet av regelefterlevnad av uppgifterna.

Det finns tre faser i datamodelleringsprocessen: den konceptuella modellen, den logiska modellen och den fysiska modellen. Varje fas, eller steg i modellens utveckling, tjänar ett specifikt syfte. Dessutom finns det flera "typer" av modeller.

Visuella datamodeller liknar en arkitekts ritningar och kan stödjas med länkad text för att ge vägledning vid utveckling eller förändring av datasystemet. Exempel på visuella datamodeller finns här..

Fördelarna och utmaningarna med datamodellering

Att utveckla en datamodell ger en karta och ett kommunikationsverktyg för att skapa eller modifiera ett datasystem. Datamodelleringskoncept gör konstruktionen av ett datasystem mycket, mycket enklare. Den nybyggda databasen och/eller datasystemet bör stödja god organisatorisk kommunikation. Det bör också stödja realtidsprojekt, inklusive insamling av data om utgiftsmönster, fakturor och andra affärsprocesser.

Datamodelleringsprocessen kan användas för att identifiera Datakvalitetsproblem, inklusive dubbletter, redundanta och saknade data.

En svårighet med att skapa en datamodell är bristande förståelse för datasystem – ett problem som normalt elimineras genom att bygga modellen. Ett annat problem är att en liten förändring inom ett område kan kräva betydande förändringar inom andra områden. Dessutom kan det vara lätt att bli så fokuserad på datasystemets struktur att styrkorna och svagheterna hos enskilda applikationer ignoreras.

Viktiga frågor att ställa

Att utveckla en datamodell börjar med att samla in information om organisationens behov, krav och mål. En modell av en del av systemet kommer att kräva färre frågor än att utveckla en modell för ett helt nytt system. Några grundläggande frågor att ställa för en modell av en del av systemet är: 

  • Vad är syftet eller målet med förändringarna?
  • Vilka typer av data arbetar systemet med för närvarande?
  • Vilken data behövs?
  • Vilka verktyg eller mjukvara behövs för att nå målet?
  • Är verktygen eller programvaran kompatibla?

En datamodell ska byggas kring organisationens behov och är en viktig faktor för att utveckla en ny modell eller justera en gammal. Frågorna som ställs när man designar en databas, eller ett helt nytt system, kräver ofta mycket mer omfattande svar. Det är bäst att inkludera en femårig affärsplan när du svarar på dessa frågor: 

  • Vilka är verksamhetens mål (forskning, försäljning, apputveckling, redovisningstjänster)? Detta kommer att avgöra de bästa typerna av programvara för att stödja verksamheten (NoSQL eller grafik för forskning, SQL för grundläggande försäljning eller redovisning, tillgång till olika moln eller flera molntjänster för apputveckling).
  • Vilka typer av programvara är mest lämpliga och kostnadseffektiva för organisationen?
  • Hur många personer kommer att få åtkomst till systemet samtidigt?
  • Hur många avdelningar finns det och hur många personer finns det på varje avdelning?
  • Kommer olika avdelningar att kräva olika typer av programvara?
  • Finns det några ovanliga behov som bör beaktas? 
  • Hur mycket data kommer att behöva lagras?
  • Är skalbarhet ett problem?
  • Kommer databasen att ansluta till affärsunderrättelseverktyg?
  • Behövs onlineanalysfrågor (OLAP), transaktionsbearbetning (OLTP) eller båda?
  • Kommer databasen att integreras med den nuvarande teknikstacken?
  • Behöver dataformatet omvandlas?
  • Vilka är dina föredragna programmeringsspråk?
  • Kommer det att integreras med någon maskininlärningsprogramvara?

Datamodelleringens tre faser

Datamodellering blev viktig under 1960s, när ledningsinformationssystem först blev populära. (Före 60-talet fanns det lite i vägen för faktisk datalagring. Dåtidens datorer var i grunden gigantiska miniräknare.) 

När det gäller datamodelleringskoncept byggs en fullt utvecklad datamodell ofta i tre faser: den konceptuella modellen, den logiska modellen och den fysiska modellen. Denna designprocess ger en tydlig förståelse av datasystemet och hur data flödar genom det. Denna process visar också hur lagringsprocedurerna fungerar och hjälper till att säkerställa att alla dataobjekt i systemet är representerade. (Om data är information som har lagrats elektroniskt är ett dataobjekt en individuell samling av information som lagras elektroniskt, till exempel en fil eller en datatabell.)

Den konceptuella datamodellen används vanligtvis för att beskriva systemets mest grundläggande komponenter och hur data rör sig genom systemet. De konceptuell datamodell kommunicerar hur information rör sig genom en avdelning och vidare till nästa. Den visar breda entiteter (representationer av saker som existerar i verkligheten) och deras relationer (associationer som finns mellan två eller flera entiteter). Detaljerad information utelämnas i allmänhet.

Den logiska datamodellen fokuserar normalt på layouten och strukturen av dataobjekt inom modellen och etablerar relationerna mellan dem. Det ger också en grund för att bygga den fysiska modellen. De logisk datamodell lägger till användbar information till den konceptuella modellen.

Den fysiska datamodellen är i huvudsak a förimplementeringsmodell och är mycket detaljerad och ofta fokuserad på databasdesignen. Den visar nödvändiga detaljer för att utveckla databasen (men kan också användas för att implementera en ny del av systemet). Detta datamodelleringskoncept gör det mycket lättare att visualisera datastrukturen genom att kommunicera databasbegränsningar, kolumnnycklar, utlösare och andra datahanteringsfunktioner. Denna modell kommunicerar även åtkomstprofiler, behörigheter, primära och främmande nycklar, etc.

Olika typer av datamodeller

Nedan följer några exempel på olika typer av datamodeller.

Den hierarkiska modellen är ganska gammal och var ganska populär på 1960- och 70-talen. Den organiserar data i trädliknande strukturer. Idag används den främst för att lagra arkivsystem och geografisk information. I den hierarkisk modell, är informationen organiserad i en en-till-många-relation med datafilerna.

Nätverksmodellen liknar den hierarkiska modellen och tillåter skapandet av olika relationer med länkade poster. De nätverksmodell tillåter människor att konstruera modellen med hjälp av uppsättningar av relaterade poster. Varje post är associerad med flera filer och dataobjekt, vilket främjar och presenterar komplexa relationer.

Entitetsrelationsmodellen är en grafisk representation av datafiler och enheter och deras relationer. Den försöker skapa verkliga scenarier. Som en datasystemmodell är entitetsrelationsmodell utvecklar en entitetsuppsättning, en relationsuppsättning, attribut och begränsningar. De används ofta för att utforma relationsdatabaser.

Grafdatamodellen kräver att man bestämmer vilka enheter i din datauppsättning som ska vara noder, vilka som ska vara länkar och vilka som ska kasseras. Grafdatamodellen ger en layout av datans enheter, egenskaper och relationer. Processen är repetitiv, förlitar sig på försök och misstag och kan vara tråkig, men är värd att göra rätt.  

Den objektorienterade databasmodellen fokuserar på dataobjekt associerade med metoder och funktioner. Den innehåller tabeller men är inte nödvändigtvis begränsad till tabeller. Data och dess relationer lagras tillsammans som en enda enhet (ett dataobjekt). Dataobjekt representerar verkliga enheter. De objektorienterad databasmodell hanterar en mängd olika format och används för forskning.

Relationsmodellen, ofta kallad SQL, är för närvarande den mest populära datamodellen. Den använder tvådimensionella tabeller för att lagra data och kommunicera relationer. All data av en viss typ lagras i rader som en del av en tabell. Tabellerna representerar relationer, och sammanfogning av dem upprättar relationerna mellan den lagrade datan. Den relationella databasmodellen är en mogen modell som stöds av en enorm mängd programvara för en mängd olika ändamål.

NoSQL-datamodellen använder inte rader och kolumner och använder egentligen inte någon form av en uppsättningsstruktur. Deras utveckling och design är vanligtvis fokuserade på att skapa fysiska datamodeller. Skalbarhet, med dess specifika egenskaper och problem, är ett stort problem. 

En objektrelationell databasmodell kombinerar den objektorienterade databasmodellen med relationsdatabasen Model. Den lagrar objekt, klasser, arv, etc., på samma sätt som en objektorienterad modell, men stöder också tabellstrukturer som den relationella databasmodellen. Denna design tillåter designers att införliva dess funktioner i en tabellstruktur.

Vikten av datamodelleringskoncept

Datamodeller är som ritningar, men de definierar relationerna, enheterna och attributen för en databas eller datasystem. En organiserad och väldesignad datamodell är nödvändig för att utveckla en effektiv fysisk databas och datasystem. En god förståelse för datamodelleringskoncept behövs för att eliminera lagringsproblem och redundansproblem samtidigt som effektiv datahämtning stöds. 

Datamodellering kan vara en utmaning, och det är viktigt att inse att varje typ av modell har sina egna fördelar och nackdelar. 

Bilden används under licens från Shutterstock.com

Tidsstämpel:

Mer från DATAVERSITET