Datenmodellierungskonzepte für Anfänger

Neuauflage von Plato

Verfolger: 0

Die Konzepte der Datenmodellierung unterstützen ein ganzheitliches Bild davon, wie sich Daten durch ein System bewegen. Datenmodellierung kann als der Prozess des Entwurfs eines Datensystems oder eines Teils eines Datensystems beschrieben werden. Diese Modelle können von Speichersystemen über Datenbanken bis hin zur gesamten Datenstruktur der Organisation reichen. Datenmodelle können als Entwurf für die Implementierung eines neuen Systems oder als Referenzmaterial für bereits etablierte Systeme verwendet werden.

Ein „vollständiges“ Datenmodell sollte die Arten von Daten kommunizieren, die in einem Datensystem verwendet und gespeichert werden, die verwendeten Formate, die Beziehungen zwischen Datendateien und die Art und Weise, wie die Daten gruppiert und organisiert werden können.

Viele Unternehmen entwickeln einzigartige, individuelle Datenmodelle (und die daraus resultierenden einzigartigen, individuellen Datensysteme), die auf die spezifischen Bedürfnisse und Anforderungen des Unternehmens zugeschnitten sind. Diese Modelle können verwendet werden, um die Datenbewegung durch das System zu visualisieren. Ein Datenmodell kann versuchen, alle Aspekte des Datenflusses durch eine Organisation oder bestimmte Parameter abzudecken, beispielsweise nur die Anzeige von Verkaufsdaten für Forschungszwecke.

Ein gut gestaltetes Datenmodell wird dies erklären Geschäftsregeln, sowie die Notwendigkeit für Einhaltung gesetzlicher Vorschriften der Daten.

Der Datenmodellierungsprozess besteht aus drei Phasen: dem konzeptionellen Modell, dem logischen Modell und dem physischen Modell. Jede Phase oder Stufe der Modellentwicklung dient einem bestimmten Zweck. Darüber hinaus gibt es mehrere „Typen“ von Modellen.

Visuelle Datenmodelle ähneln den Bauplänen eines Architekten und können mit verknüpftem Text unterstützt werden, um bei der Entwicklung oder Änderung des Datensystems Orientierung zu geben. Beispiele für visuelle Datenmodelle finden Sie hier hier.

Die Vorteile und Herausforderungen der Datenmodellierung

Die Entwicklung eines Datenmodells stellt eine Karte und ein Kommunikationstool zum Erstellen oder Ändern eines Datensystems bereit. Datenmodellierungskonzepte erleichtern den Aufbau eines Datensystems erheblich. Die neu aufgebaute Datenbank und/oder das Datensystem sollten eine gute organisatorische Kommunikation unterstützen. Es sollte auch Echtzeitprojekte unterstützen, einschließlich der Erfassung von Daten zu Ausgabenmustern, Rechnungen und anderen Geschäftsprozessen.

Der Datenmodellierungsprozess kann zur Identifizierung verwendet werden Probleme mit der Datenqualität, einschließlich doppelter, redundanter und fehlender Daten.

Eine Schwierigkeit bei der Erstellung eines Datenmodells ist mangelndes Verständnis der Datensysteme – ein Problem, das normalerweise durch die Erstellung des Modells behoben wird. Ein weiteres Problem besteht darin, dass eine kleine Änderung in einem Bereich möglicherweise erhebliche Änderungen in anderen Bereichen erforderlich macht. Darüber hinaus kann es leicht passieren, dass man sich so sehr auf die Struktur des Datensystems konzentriert, dass die Stärken und Schwächen einzelner Anwendungen ignoriert werden.

Wichtige Fragen, die Sie stellen sollten

Die Entwicklung eines Datenmodells beginnt mit dem Sammeln von Informationen über die Bedürfnisse, Anforderungen und Ziele der Organisation. Ein Modell eines Teils des Systems erfordert weniger Fragen als die Entwicklung eines Modells für ein völlig neues System. Einige grundlegende Fragen, die für ein Modell eines Teils des Systems gestellt werden sollten, sind:

Was ist der Zweck oder das Ziel der Änderungen?
Mit welchen Arten von Daten arbeitet das System derzeit?
Welche Daten werden benötigt?
Welche Tools oder Software werden benötigt, um das Ziel zu erreichen?
Sind die Tools oder Software kompatibel?

Ein Datenmodell sollte auf die Bedürfnisse der Organisation zugeschnitten sein und ein wichtiger Faktor bei der Entwicklung eines neuen Modells oder der Anpassung eines alten sein. Die Fragen, die beim Entwurf einer Datenbank oder eines völlig neuen Systems gestellt werden, erfordern oft viel ausführlichere Antworten. Berücksichtigen Sie bei der Beantwortung dieser Fragen am besten einen Fünfjahres-Geschäftsplan:

Was sind die Ziele des Unternehmens (Forschung, Vertrieb, App-Entwicklung, Buchhaltungsdienstleistungen)? Dadurch werden die besten Arten von Software zur Unterstützung des Unternehmens ermittelt (NoSQL oder Grafiken für die Forschung, SQL für grundlegende Verkäufe oder Buchhaltung, Zugriff auf verschiedene Clouds oder mehrere Cloud-Dienste für die App-Entwicklung).
Welche Arten von Software sind für das Unternehmen am besten geeignet und kostengünstigste?
Wie viele Personen werden gleichzeitig auf das System zugreifen?
Wie viele Abteilungen gibt es und wie viele Personen sind in jeder Abteilung tätig?
Benötigen verschiedene Abteilungen unterschiedliche Arten von Software?
Gibt es ungewöhnliche Bedürfnisse, die berücksichtigt werden sollten?
Wie viele Daten müssen gespeichert werden?
Ist Skalierbarkeit ein Problem?
Wird die Datenbank eine Verbindung herstellen? Business Intelligence-Tools?
Sind Online-Analyseabfragen (OLAP), Transaktionsverarbeitung (OLTP) oder beides erforderlich?
Wird die Datenbank in den aktuellen Tech-Stack integriert?
Muss das Format der Daten geändert werden?
Was sind Ihre bevorzugten Programmiersprachen?
Wird es in irgendeine Software für maschinelles Lernen integriert werden?

Die drei Phasen der Datenmodellierung

Datenmodellierung wurde wichtig während der 1960s, als Managementinformationssysteme erstmals populär wurden. (Vor den 60er-Jahren gab es kaum Möglichkeiten zur tatsächlichen Datenspeicherung. Die damaligen Computer waren im Grunde riesige Taschenrechner.)

Im Hinblick auf Datenmodellierungskonzepte wird ein vollständig entwickeltes Datenmodell häufig in drei Phasen erstellt: dem konzeptionellen Modell, dem logischen Modell und dem physischen Modell. Dieser Entwurfsprozess bietet ein klares Verständnis des Datensystems und des Datenflusses durch dieses. Dieser Prozess zeigt auch, wie die Speicherverfahren funktionieren und trägt dazu bei, dass alle Datenobjekte im System dargestellt werden. (Wenn es sich bei Daten um elektronisch gespeicherte Informationen handelt, handelt es sich bei einem Datenobjekt um eine einzelne Sammlung elektronisch gespeicherter Informationen, beispielsweise eine Datei oder eine Datentabelle.)

Das konzeptionelle Datenmodell wird normalerweise verwendet, um die grundlegendsten Komponenten des Systems und die Art und Weise zu beschreiben, wie sich die Daten durch das System bewegen. Der konzeptionelles Datenmodell kommuniziert, wie Informationen von einer Abteilung zur nächsten gelangen. Es zeigt umfassende Entitäten (Darstellungen von Dingen, die in der Realität existieren) und ihre Beziehungen (Assoziationen, die zwischen zwei oder mehr Entitäten bestehen). Auf detaillierte Angaben wird grundsätzlich verzichtet.

Das logische Datenmodell konzentriert sich normalerweise auf das Layout und die Struktur von Datenobjekten innerhalb des Modells und stellt die Beziehungen zwischen ihnen her. Es bietet auch eine Grundlage für die Erstellung des physikalischen Modells. Der logisches Datenmodell Fügt dem konzeptionellen Modell nützliche Informationen hinzu.

Das physische Datenmodell ist im Wesentlichen ein Modell vor der Implementierung und ist sehr detailliert und konzentriert sich oft auf das Datenbankdesign. Es zeigt die notwendigen Details zur Entwicklung der Datenbank (kann aber auch zur Implementierung eines neuen Teils des Systems verwendet werden). Dieses Datenmodellierungskonzept erleichtert die Visualisierung der Datenstruktur erheblich, indem es Datenbankeinschränkungen, Spaltenschlüssel, Trigger und andere Datenverwaltungsfunktionen kommuniziert. Dieses Modell kommuniziert auch Zugriffsprofile, Berechtigungen, Primär- und Fremdschlüssel usw.

Verschiedene Arten von Datenmodellen

Nachfolgend finden Sie einige Beispiele für die verschiedenen Arten von Datenmodellen.

Das hierarchische Modell ist ziemlich alt und war in den 1960er und 70er Jahren sehr beliebt. Es organisiert die Daten in baumartigen Strukturen. Heutzutage wird es hauptsächlich zur Speicherung von Dateisystemen und geografischen Informationen verwendet. Im hierarchisches Modell, werden die Daten in einer Eins-zu-viele-Beziehung mit den Datendateien organisiert.

Das Netzwerkmodell ähnelt dem hierarchischen Modell und ermöglicht die Erstellung verschiedener Beziehungen zu verknüpften Datensätzen. Der Netzwerkmodell ermöglicht es Benutzern, das Modell mithilfe von Sätzen verwandter Datensätze zu erstellen. Jeder Datensatz ist mit mehreren Dateien und Datenobjekten verknüpft, wodurch komplexe Beziehungen gefördert und dargestellt werden.

Das Entity-Relationship-Modell ist eine grafische Darstellung von Datendateien und Entitäten und ihren Beziehungen. Es wird versucht, reale Szenarien zu erstellen. Als Datensystemmodell dient das Entity-Relationship-Modell entwickelt einen Entitätssatz, einen Beziehungssatz, Attribute und Einschränkungen. Sie werden häufig beim Entwurf relationaler Datenbanken verwendet.

Das Diagrammdatenmodell erfordert die Festlegung, welche Entitäten in Ihrem Datensatz als Knoten, welche als Links und welche verworfen werden sollen. Das Diagrammdatenmodell Bietet ein Layout der Entitäten, Eigenschaften und Beziehungen der Daten. Der Prozess ist repetitiv, basiert auf Versuch und Irrtum und kann mühsam sein, es lohnt sich aber, ihn richtig zu machen.

Das objektorientierte Datenbankmodell Der Schwerpunkt liegt auf Datenobjekten, die Methoden und Funktionen zugeordnet sind. Es enthält Tabellen, ist aber nicht unbedingt auf Tabellen beschränkt. Daten und ihre Beziehungen werden zusammen als eine einzige Einheit (ein Datenobjekt) gespeichert. Datenobjekte repräsentieren reale Entitäten. Der objektorientiertes Datenbankmodell verarbeitet eine Vielzahl von Formaten und wird für Forschungszwecke verwendet.

Das relationale Modell, oft als SQL bezeichnet, ist derzeit das beliebteste Datenmodell. Es verwendet zweidimensionale Tabellen zum Speichern von Daten und zum Kommunizieren von Beziehungen. Alle Daten eines bestimmten Typs werden in Zeilen als Teil einer Tabelle gespeichert. Die Tabellen stellen Beziehungen dar und durch deren Verknüpfung werden die Beziehungen zwischen den gespeicherten Daten hergestellt. Das relationale Datenbankmodell ist ein ausgereiftes Modell, das von einer riesigen Menge an Software für verschiedene Zwecke unterstützt wird.

Das NoSQL-Datenmodell verwendet keine Zeilen und Spalten und verwendet eigentlich keine festgelegte Struktur. Ihre Entwicklung und Gestaltung konzentrieren sich typischerweise auf die Erstellung physischer Datenmodelle. Die Skalierbarkeit mit ihren spezifischen Macken und Problemen ist ein wichtiges Anliegen.

Ein objektrelationales Datenbankmodell kombiniert das objektorientierte Datenbankmodell mit dem relationalen Datenbankmodell. Es speichert Objekte, Klassen, Vererbungen usw. auf die gleiche Weise wie ein objektorientiertes Modell, unterstützt aber auch tabellarische Strukturen wie das relationale Datenbankmodell. Dieser Entwurf ermöglicht es Designern, seine Funktionen in eine Tischstruktur zu integrieren.

Die Bedeutung von Datenmodellierungskonzepten

Datenmodelle sind wie Blaupausen, aber sie definieren die Beziehungen, Entitäten und Attribute einer Datenbank oder eines Datensystems. Für die Entwicklung einer effizienten physischen Datenbank und eines Datensystems ist ein organisiertes und gut gestaltetes Datenmodell erforderlich. Um Speicherprobleme und Redundanzprobleme zu beseitigen und gleichzeitig einen effizienten Datenabruf zu unterstützen, ist ein gutes Verständnis der Datenmodellierungskonzepte erforderlich.

Die Datenmodellierung kann eine Herausforderung sein, und es ist wichtig zu erkennen, dass jeder Modelltyp seine eigenen Vor- und Nachteile hat.

Bild verwendet unter Lizenz von Shutterstock.com