Concetti di modellazione dei dati per principianti

Concetti di modellazione dei dati per principianti

Nodo di origine: 2623283
concetti di modellazione dei daticoncetti di modellazione dei dati

I concetti di modellazione dei dati supportano un quadro olistico di come i dati si muovono attraverso un sistema. La modellazione dei dati può essere descritta come il processo di progettazione di un sistema di dati o di parte di un sistema di dati. Questi modelli possono variare dai sistemi di archiviazione ai database fino all’intera struttura dati dell’organizzazione. I modelli di dati possono essere utilizzati come progetto per l'implementazione di un nuovo sistema o come materiale di riferimento per sistemi già consolidati. 

Un modello di dati “completo” dovrebbe comunicare i tipi di dati utilizzati e archiviati all’interno di un sistema di dati, i formati utilizzati, le relazioni tra i file di dati e i modi in cui i dati possono essere raggruppati e organizzati.

Molte aziende sviluppano modelli di dati unici e individuali (e i risultanti sistemi di dati unici e individuali) costruiti attorno alle esigenze e ai requisiti specifici dell’organizzazione. Questi modelli possono essere utilizzati per visualizzare il movimento dei dati attraverso il sistema. Un modello di dati può tentare di coprire tutti gli aspetti del flusso di dati attraverso un'organizzazione o parametri specifici, ad esempio mostrare solo i dati di vendita a fini di ricerca.

Un modello di dati ben progettato spiegherà il regole aziendali, nonché la necessità di conformità normativa dei dati.

Esistono tre fasi nel processo di modellazione dei dati: il modello concettuale, il modello logico e il modello fisico. Ogni fase, o stadio dello sviluppo del modello, ha uno scopo specifico. Inoltre, esistono diversi “tipi” di modelli.

I modelli di dati visivi sono simili ai progetti di un architetto e possono essere supportati con testo collegato per fornire indicazioni durante lo sviluppo o la modifica del sistema di dati. È possibile trovare esempi di modelli di dati visivi qui.

I vantaggi e le sfide della modellazione dei dati

Lo sviluppo di un modello di dati fornisce una mappa e uno strumento di comunicazione per creare o modificare un sistema di dati. I concetti di modellazione dei dati rendono la costruzione di un sistema di dati molto, molto più semplice. Il database e/o il sistema di dati di nuova costruzione dovrebbero supportare buone comunicazioni organizzative. Dovrebbe inoltre supportare progetti in tempo reale, inclusa la raccolta di dati su modelli di spesa, fatture e altri processi aziendali.

Il processo di modellazione dei dati può essere utilizzato per identificare Problemi di qualità dei dati, inclusi dati duplicati, ridondanti e mancanti.

Una difficoltà nella creazione di un modello di dati è la mancanza di comprensione dei sistemi di dati, un problema normalmente eliminato costruendo il modello. Un altro problema è che un piccolo cambiamento in un’area può richiedere cambiamenti significativi in ​​altre aree. Inoltre, può essere facile concentrarsi così tanto sulla struttura del sistema dati da ignorare i punti di forza e di debolezza delle singole applicazioni.

Domande importanti da porre

Lo sviluppo di un modello di dati inizia con la raccolta di informazioni sulle esigenze, i requisiti e gli obiettivi dell’organizzazione. Un modello di parte del sistema richiederà meno domande rispetto allo sviluppo di un modello per un sistema completamente nuovo. Alcune domande fondamentali da porre per un modello di parte del sistema sono: 

  • Qual è lo scopo o l’obiettivo dei cambiamenti?
  • Con quali tipi di dati funziona attualmente il sistema?
  • Quali dati sono necessari?
  • Quali strumenti o software sono necessari per raggiungere l’obiettivo?
  • Gli strumenti o il software sono compatibili?

Un modello di dati dovrebbe essere costruito attorno alle esigenze dell’organizzazione e costituisce un fattore importante nello sviluppo di un nuovo modello o nell’adeguamento di quello vecchio. Le domande poste quando si progetta un database, o un sistema completamente nuovo, spesso richiedono risposte molto più ampie. È meglio incorporare un piano aziendale quinquennale quando si risponde a queste domande: 

  • Quali sono gli obiettivi dell’azienda (ricerca, vendite, sviluppo di app, servizi contabili)? Ciò determinerà i migliori tipi di software per supportare l'azienda (NoSQL o grafica per la ricerca, SQL per vendite o contabilità di base, accesso a vari cloud o diversi servizi cloud per lo sviluppo di app).
  • Quali tipi di software sono più appropriati ed economici per l'organizzazione?
  • Quante persone accederanno al sistema contemporaneamente?
  • Quanti dipartimenti ci sono e quante persone ci sono in ciascun dipartimento?
  • I diversi dipartimenti richiederanno diversi tipi di software?
  • Ci sono esigenze insolite che dovrebbero essere prese in considerazione? 
  • Quanti dati dovranno essere archiviati?
  • La scalabilità è un problema?
  • Il database si connetterà a strumenti di business intelligence?
  • Sono necessarie le query analitiche online (OLAP), l'elaborazione delle transazioni (OLTP) o entrambe?
  • Il database si integrerà con l’attuale stack tecnologico?
  • Il formato dei dati dovrà essere trasformato?
  • Quali sono i tuoi linguaggi di programmazione preferiti?
  • Sarà integrato con qualche software di machine learning?

Le tre fasi della modellazione dei dati

La modellazione dei dati è diventata importante durante gli 1960, quando i sistemi informativi gestionali cominciavano a diffondersi. (Prima degli anni ’60, c’era poco in termini di archiviazione dei dati. I computer di quel tempo erano fondamentalmente calcolatori giganti.) 

In termini di concetti di modellazione dei dati, un modello di dati completamente sviluppato viene spesso costruito in tre fasi: il modello concettuale, il modello logico e il modello fisico. Questo processo di progettazione fornisce una chiara comprensione del sistema di dati e del modo in cui i dati lo attraversano. Questo processo mostra anche come funzionano le procedure di archiviazione e aiuta a garantire che tutti gli oggetti dati nel sistema siano rappresentati. (Se i dati sono informazioni archiviate elettronicamente, un oggetto dati è una raccolta individuale di informazioni archiviate elettronicamente, ad esempio un file o una tabella di dati.)

Il modello concettuale dei dati viene generalmente utilizzato per descrivere i componenti più basilari del sistema e il modo in cui i dati si muovono attraverso il sistema. IL modello concettuale dei dati comunica il modo in cui le informazioni si spostano da un reparto a quello successivo. Mostra entità generali (rappresentazioni di cose che esistono nella realtà) e le loro relazioni (associazioni che esistono tra due o più entità). Le informazioni dettagliate vengono generalmente omesse.

Il modello logico dei dati normalmente si concentra sul layout e sulla struttura degli oggetti dati all'interno del modello e stabilisce le relazioni tra loro. Fornisce inoltre una base per la costruzione del modello fisico. IL modello di dati logico aggiunge informazioni utili al modello concettuale.

Il modello fisico dei dati è essenzialmente un modello di pre-implementazione ed è molto dettagliato e spesso focalizzato sulla progettazione del database. Mostra i dettagli necessari per lo sviluppo del database (ma può anche essere utilizzato per implementare una nuova parte del sistema). Questo concetto di modellazione dei dati rende la visualizzazione della struttura dei dati molto più semplice comunicando vincoli del database, chiavi di colonna, trigger e altre funzionalità di gestione dei dati. Questo modello comunica anche profili di accesso, autorizzazioni, chiavi primarie ed esterne, ecc.

Diversi tipi di modelli di dati

Di seguito sono riportati alcuni esempi dei diversi tipi di modelli di dati.

Il modello gerarchico è piuttosto vecchio ed era piuttosto popolare negli anni '1960 e '70. Organizza i dati in strutture ad albero. Oggi viene utilizzato principalmente per archiviare sistemi di archiviazione e informazioni geografiche. Nel modello gerarchico, i dati sono organizzati in una relazione uno-a-molti con i file di dati.

Il modello di rete è simile al modello gerarchico e permette di creare diverse relazioni con record collegati. IL modello di rete consente alle persone di costruire il modello utilizzando insiemi di record correlati. Ogni record è associato a più file e oggetti dati, promuovendo e presentando relazioni complesse.

Il modello entità-relazione è una rappresentazione grafica di file di dati ed entità e delle loro relazioni. Tenta di creare scenari del mondo reale. Come modello di sistema di dati, il modello entità-relazione sviluppa un insieme di entità, un insieme di relazioni, attributi e vincoli. Sono spesso utilizzati nella progettazione di database relazionali.

Il modello dei dati grafici richiede di determinare quali entità all'interno del set di dati dovrebbero essere designate nodi, quali dovrebbero essere designati collegamenti e quali dovrebbero essere scartate. Il modello dei dati grafici fornisce un layout delle entità, delle proprietà e delle relazioni dei dati. Il processo è ripetitivo, si basa su tentativi ed errori e può essere noioso, ma vale la pena farlo nel modo giusto.  

Il modello di database orientato agli oggetti si concentra sugli oggetti dati associati a metodi e funzionalità. Incorpora tabelle ma non è necessariamente limitato alle tabelle. I dati e le relative relazioni vengono archiviati insieme come una singola entità (un oggetto dati). Gli oggetti dati rappresentano entità del mondo reale. IL modello di database orientato agli oggetti gestisce una varietà di formati e viene utilizzato per la ricerca.

Il modello relazionale, spesso indicato come SQL, è attualmente il modello di dati più popolare. Utilizza tabelle bidimensionali per archiviare dati e comunicare relazioni. Tutti i dati di un certo tipo vengono archiviati in righe come parte di una tabella. Le tabelle rappresentano le relazioni e unirle stabilisce le relazioni tra i dati archiviati. Il modello del database relazionale è un modello maturo supportato da un'enorme quantità di software per una varietà di scopi.

Il modello di dati NoSQL non utilizza righe e colonne e in realtà non utilizza alcun tipo di struttura fissa. Il loro sviluppo e progettazione sono in genere focalizzati sulla creazione di modelli di dati fisici. La scalabilità, con le sue peculiarità e i suoi problemi, è una preoccupazione significativa. 

Un modello di database relazionale a oggetti combina il modello di database orientato agli oggetti con il modello di database relazionale. Memorizza oggetti, classi, ereditarietà, ecc., allo stesso modo di un modello orientato agli oggetti, ma supporta anche strutture tabulari come il modello di database relazionale. Questo design consente ai progettisti di incorporare le sue caratteristiche nella struttura di un tavolo.

L'importanza dei concetti di modellazione dei dati

I modelli di dati sono come progetti, ma definiscono le relazioni, le entità e gli attributi di un database o di un sistema di dati. Un modello di dati organizzato e ben progettato è necessario per sviluppare un database fisico e un sistema di dati efficienti. È necessaria una buona comprensione dei concetti di modellazione dei dati per eliminare i problemi di archiviazione e di ridondanza supportando al tempo stesso un recupero efficiente dei dati. 

La modellazione dei dati può rappresentare una sfida ed è importante riconoscere che ogni tipo di modello presenta vantaggi e svantaggi. 

Immagine utilizzata su licenza di Shutterstock.com

Timestamp:

Di più da VERSITÀ DEI DATI