Conceitos de modelagem de dados para iniciantes

Conceitos de modelagem de dados para iniciantes

Nó Fonte: 2623283
conceitos de modelagem de dadosconceitos de modelagem de dados

Os conceitos de Modelagem de Dados suportam uma imagem holística de como os dados se movem através de um sistema. Modelagem de dados pode ser descrita como o processo de projetar um sistema de dados ou parte de um sistema de dados. Esses modelos podem variar de sistemas de armazenamento a bancos de dados e toda a estrutura de dados da organização. Os modelos de dados podem ser usados ​​como projeto para implementação de um novo sistema ou como material de referência para sistemas já estabelecidos. 

Um modelo de dados “completo” deve comunicar os tipos de dados que são utilizados e armazenados num sistema de dados, os formatos utilizados, as relações entre ficheiros de dados e as formas como os dados podem ser agrupados e organizados.

Muitas empresas desenvolvem modelos de dados individuais e únicos (e os sistemas de dados individuais e únicos resultantes) construídos em torno das necessidades e requisitos específicos da organização. Esses modelos podem ser usados ​​para visualizar a movimentação de dados através do sistema. Um modelo de dados pode tentar cobrir todos os aspectos do fluxo de dados através de uma organização, ou parâmetros específicos, como mostrar apenas dados de vendas para fins de pesquisa.

Um modelo de dados bem projetado explicará o regras de negócio, bem como a necessidade conformidade regulatória dos dados.

Existem três fases no processo de Modelagem de Dados: o modelo conceitual, o modelo lógico e o modelo físico. Cada fase, ou estágio de desenvolvimento do modelo, atende a um propósito específico. Além disso, existem vários “tipos” de modelos.

Os modelos de dados visuais são semelhantes aos projetos de um arquiteto e podem ser apoiados com texto vinculado para fornecer orientação ao desenvolver ou alterar o sistema de dados. Exemplos de modelos de dados visuais podem ser encontrados SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Os benefícios e desafios da modelagem de dados

O desenvolvimento de um modelo de dados fornece um mapa e uma ferramenta de comunicação para criar ou modificar um sistema de dados. Os conceitos de modelagem de dados tornam a construção de um sistema de dados muito, muito mais fácil. O banco de dados e/ou sistema de dados recém-construído deve apoiar boas comunicações organizacionais. Deve também apoiar projetos em tempo real, incluindo a recolha de dados sobre padrões de despesas, faturas e outros processos empresariais.

O processo de Modelagem de Dados pode ser usado para identificar Problemas de qualidade de dados, incluindo dados duplicados, redundantes e ausentes.

Uma dificuldade na criação de um modelo de dados é a falta de compreensão dos sistemas de dados – um problema normalmente eliminado pela construção do modelo. Outro problema é que uma pequena mudança numa área pode exigir mudanças significativas em outras áreas. Além disso, pode ser fácil ficar tão focado na estrutura do sistema de dados que os pontos fortes e fracos dos aplicativos individuais são ignorados.

Perguntas importantes a serem feitas

O desenvolvimento de um modelo de dados começa com a coleta de informações sobre as necessidades, requisitos e objetivos da organização. Um modelo de parte do sistema exigirá menos perguntas do que desenvolver um modelo para um sistema inteiramente novo. Algumas perguntas básicas a serem feitas para um modelo de parte do sistema são: 

  • Qual é o propósito ou objetivo das mudanças?
  • Com quais tipos de dados o sistema está trabalhando atualmente?
  • Quais dados são necessários?
  • Quais ferramentas ou software são necessários para atingir o objetivo?
  • As ferramentas ou software são compatíveis?

Um modelo de dados deve ser construído em torno das necessidades da organização e é um fator importante no desenvolvimento de um novo modelo ou no ajuste de um modelo antigo. As perguntas feitas ao projetar um banco de dados ou um sistema totalmente novo geralmente exigem respostas muito mais extensas. É melhor incorporar um plano de negócios de cinco anos ao responder a estas perguntas: 

  • Quais são os objetivos do negócio (pesquisa, vendas, desenvolvimento de aplicativos, serviços de contabilidade)? Isso determinará os melhores tipos de software para apoiar o negócio (NoSQL ou gráficos para pesquisa, SQL para vendas básicas ou contabilidade, acesso a várias nuvens ou vários serviços em nuvem para desenvolvimento de aplicativos).
  • Que tipos de software são mais apropriados e econômicos para a organização?
  • Quantas pessoas acessarão o sistema simultaneamente?
  • Quantos departamentos existem e quantas pessoas há em cada departamento?
  • Diferentes departamentos exigirão diferentes tipos de software?
  • Existem necessidades incomuns que devem ser consideradas? 
  • Quantos dados precisarão ser armazenados?
  • A escalabilidade é um problema?
  • O banco de dados se conectará a ferramentas de inteligência de negócios?
  • São necessárias consultas analíticas online (OLAP), processamento de transações (OLTP) ou ambos?
  • O banco de dados será integrado à pilha de tecnologia atual?
  • O formato dos dados precisará ser transformado?
  • Quais são suas linguagens de programação preferidas?
  • Será integrado a algum software de aprendizado de máquina?

As três fases da modelagem de dados

Modelagem de dados tornou-se importante durante os 1960s, quando os sistemas de informação gerencial estavam se tornando populares. (Antes dos anos 60, havia pouco armazenamento real de dados. Os computadores daquela época eram basicamente calculadoras gigantes.) 

Em termos de conceitos de Modelagem de Dados, um modelo de dados totalmente desenvolvido é frequentemente construído em três fases: o modelo conceitual, o modelo lógico e o modelo físico. Este processo de design fornece uma compreensão clara do sistema de dados e de como os dados fluem através dele. Este processo também mostra como funcionam os procedimentos de armazenamento e ajuda a garantir que todos os objetos de dados no sistema sejam representados. (Se os dados são informações armazenadas eletronicamente, então um objeto de dados é uma coleção individual de informações armazenadas eletronicamente, como um arquivo ou uma tabela de dados.)

O modelo de dados conceituais é normalmente usado para descrever os componentes mais básicos do sistema e como os dados se movem pelo sistema. O modelo de dados conceituais comunica como a informação se move através de um departamento e para o próximo. Mostra entidades amplas (representações de coisas que existem na realidade) e suas relações (associações que existem entre duas ou mais entidades). Informações detalhadas são geralmente omitidas.

O modelo de dados lógicos normalmente concentra-se no layout e na estrutura dos objetos de dados dentro do modelo e estabelece os relacionamentos entre eles. Ele também fornece uma base para a construção do modelo físico. O modelo de dados lógicos adiciona informações úteis ao modelo conceitual.

O modelo de dados físicos é essencialmente um modelo de pré-implementação e é muito detalhado e frequentemente focado no design do banco de dados. Mostra os detalhes necessários para o desenvolvimento do banco de dados (mas também pode ser utilizado para implementar uma nova parte do sistema). Este conceito de modelagem de dados torna a visualização da estrutura de dados muito mais fácil, comunicando restrições de banco de dados, chaves de coluna, gatilhos e outros recursos de gerenciamento de dados. Este modelo também comunica perfis de acesso, autorizações, chaves primárias e estrangeiras, etc.

Diferentes tipos de modelos de dados

Abaixo estão alguns exemplos dos diferentes tipos de modelos de dados.

O modelo hierárquico é bastante antigo e era bastante popular nas décadas de 1960 e 70. Ele organiza os dados em estruturas semelhantes a árvores. Hoje, é usado principalmente para armazenar sistemas de arquivamento e informações geográficas. No modelo hierárquico, os dados são organizados em um relacionamento um-para-muitos com os arquivos de dados.

O modelo de rede é semelhante ao modelo hierárquico e permite a criação de diversos relacionamentos com registros vinculados. O modelo de rede permite que as pessoas construam o modelo usando conjuntos de registros relacionados. Cada registro está associado a múltiplos arquivos e objetos de dados, promovendo e apresentando relacionamentos complexos.

O modelo entidade-relacionamento é uma representação gráfica de arquivos de dados e entidades e seus relacionamentos. Ele tenta criar cenários do mundo real. Como modelo de sistema de dados, o modelo entidade-relacionamento desenvolve um conjunto de entidades, um conjunto de relacionamentos, atributos e restrições. Eles são frequentemente usados ​​no projeto de bancos de dados relacionais.

O modelo de dados gráficos requer determinar quais entidades em seu conjunto de dados devem ser nós designados, quais devem ser links designados e quais devem ser descartados. O modelo de dados gráficos fornece um layout das entidades, propriedades e relacionamentos dos dados. O processo é repetitivo, depende de tentativa e erro e pode ser entediante, mas vale a pena ser feito da maneira certa.  

O modelo de banco de dados orientado a objetos concentra-se em objetos de dados associados a métodos e recursos. Incorpora tabelas, mas não está necessariamente limitado a tabelas. Os dados e seus relacionamentos são armazenados juntos como uma única entidade (um objeto de dados). Os objetos de dados representam entidades do mundo real. O modelo de banco de dados orientado a objetos lida com uma variedade de formatos e é usado para pesquisa.

O modelo relacional, muitas vezes referido como SQL, é atualmente o modelo de dados mais popular. Ele usa tabelas bidimensionais para armazenar dados e comunicar relacionamentos. Todos os dados de um determinado tipo são armazenados em linhas como parte de uma tabela. As tabelas representam relacionamentos e juntá-las estabelece as relações entre os dados armazenados. O modelo de banco de dados relacional é um modelo maduro suportado por uma enorme quantidade de software para diversos fins.

O modelo de dados NoSQL não usa linhas e colunas e realmente não usa nenhum tipo de estrutura de conjunto. Seu desenvolvimento e design normalmente se concentram na criação de modelos de dados físicos. A escalabilidade, com suas peculiaridades e problemas específicos, é uma preocupação significativa. 

Um modelo de banco de dados objeto-relacional combina o modelo de banco de dados orientado a objetos com o modelo de banco de dados relacional. Ele armazena objetos, classes, herança, etc., da mesma forma que um modelo orientado a objetos, mas também suporta estruturas tabulares como o modelo de banco de dados relacional. Este design permite que os designers incorporem seus recursos em uma estrutura de tabela.

A importância dos conceitos de modelagem de dados

Os modelos de dados são como projetos, mas definem os relacionamentos, entidades e atributos de um banco de dados ou sistema de dados. Um modelo de dados organizado e bem projetado é necessário para desenvolver um banco de dados físico e um sistema de dados eficientes. É necessário um bom entendimento dos conceitos de modelagem de dados para eliminar problemas de armazenamento e redundância e, ao mesmo tempo, oferecer suporte à recuperação eficiente de dados. 

A modelagem de dados pode ser um desafio e é importante reconhecer que cada tipo de modelo traz suas próprias vantagens e desvantagens. 

Imagem usada sob licença da Shutterstock.com

Carimbo de hora:

Mais de DATAVERSIDADE