初学者的数据建模概念

初学者的数据建模概念

源节点: 2623283
数据建模概念数据建模概念

数据建模的概念支持数据如何在系统中移动的整体视图。数据建模可以描述为设计数据系统或数据系统的一部分的过程。这些模型的范围可以从存储系统到数据库再到组织的整个数据结构。数据模型可以用作实现新系统的设计,也可以用作已建立系统的参考材料。 

“完整”的数据模型应该传达数据系统中使用和存储的数据类型、使用的格式、数据文件之间的关系以及数据分组和组织的方式。

许多企业围绕组织的特定需求和要求开发独特的、单独的数据模型(以及由此产生的独特的、单独的数据系统)。这些模型可用于可视化系统中的数据移动。数据模型可以尝试涵盖组织中数据流的所有方面或特定参数,例如仅显示用于研究目的的销售数据。

一个精心设计的数据模型将解释 业务规则,以及需要 合规性 的数据。

数据建模过程分为三个阶段:概念模型、逻辑模型和物理模型。模型开发的每个阶段都有特定的目的。此外,模型还有多种“类型”。

可视化数据模型类似于架构师的蓝图,可以通过链接文本支持,以在开发或更改数据系统时提供指导。可以找到可视化数据模型的示例 此处.

数据建模的好处和挑战

开发数据模型提供了用于创建或修改数据系统的地图和通信工具。数据建模概念使数据系统的构建变得非常非常容易。新建的数据库和/或数据系统应支持良好的组织沟通。它还应该支持实时项目,包括收集有关支出模式、发票和其他业务流程的数据。

数据建模过程可用于识别 数据质量问题,包括重复、冗余和缺失数据。

创建数据模型的一个困难是缺乏对数据系统的理解——这个问题通常可以通过构建模型来消除。另一个问题是,一个领域的微小变化可能需要其他领域的重大变化。此外,人们很容易过于关注数据系统的结构,而忽略了各个应用程序的优点和缺点。

要问的重要问题

开发数据模型首先收集有关组织的需求、要求和目标的信息。与为全新系统开发模型相比,系统部分模型需要的问题更少。对于系统部分模型需要询问的一些基本问题是: 

  • 变革的目的或目标是什么?
  • 系统当前正在处理哪些类型的数据?
  • 需要什么数据?
  • 需要什么工具或软件来实现目标?
  • 这些工具或软件兼容吗?

数据模型应围绕组织的需求构建,并且是开发新模型或调整旧模型的重要因素。设计数据库或全新系统时提出的问题通常需要更广泛的答案。回答这些问题时最好结合五年商业计划: 

  • 企业的目标是什么(研究、销售、应用程序开发、会计服务)?这将确定支持业务的最佳软件类型(用于研究的 NoSQL 或图形、用于基本销售或会计的 SQL、访问各种云或用于应用程序开发的多种云服务)。
  • 哪些类型的软件最适合组织且最具成本效益?
  • 有多少人同时访问该系统?
  • 有多少个部门,每个部门有多少人?
  • 不同部门需要不同种类的软件吗?
  • 是否有任何需要考虑的异常需求? 
  • 需要存储多少数据?
  • 可扩展性是一个问题吗?
  • 数据库会连接到 商业智能工具?
  • 是否需要在线分析查询 (OLAP)、事务处理 (OLTP),或两者都需要?
  • 数据库会与当前的技术堆栈集成吗?
  • 数据格式需要转换吗?
  • 您首选的编程语言是什么?
  • 它会与任何机器学习软件集成吗?

数据建模的三个阶段

数据建模变得重要 在1960s期间,当管理信息系统第一次流行时。 (在 60 年代之前,实际数据存储方式很少。当时的计算机基本上是巨型计算器。) 

就数据建模概念而言,一个完全开发的数据模型通常分三个阶段构建:概念模型、逻辑模型和物理模型。此设计过程可以让您清楚地了解数据系统以及数据如何在其中流动。此过程还显示了存储过程如何工作,并有助于确保系统中的所有数据对象都得到表示。 (如果数据是以电子方式存储的信息,那么数据对象就是以电子方式存储的信息的单独集合,例如文件或数据表。)

概念数据模型 通常用于描述系统最基本的组件以及数据如何在系统中移动。这 概念数据模型 传达信息如何在一个部门传递到下一个部门。它显示了广泛的实体(现实中存在的事物的表示)及其关系(两个或多个实体之间存在的关联)。一般省略详细信息。

逻辑数据模型 通常关注模型内数据对象的布局和结构,并建立它们之间的关系。它还为构建物理模型提供了基础。这 逻辑数据模型 向概念模型添加有用的信息。

物理数据模型 本质上是 实施前模型 并且非常详细并且通常专注于数据库设计。它显示了开发数据库所需的详细信息(但也可用于实现系统的新部分)。这种数据建模概念通过传达数据库约束、列键、触发器和其他数据管理功能,使数据结构的可视化变得更加容易。该模型还传达访问配置文件、授权、主键和外键等。

不同类型的数据模型

以下是不同类型数据模型的一些示例。

层次模型 它相当古老,在 1960 世纪 70 年代和 XNUMX 年代非常流行。它将数据组织成树状结构。如今,它主要用于存储文件系统和地理信息。在里面 层次模型,数据被组织成与数据文件的一对多关系。

网络模型 与分层模型类似,允许创建与链接记录的各种关系。这 网络模型 允许人们使用相关记录集构建模型。每个记录都与多个文件和数据对象相关联,促进和呈现复杂的关系。

实体关系模型 是数据文件和实体及其关系的图形表示。它试图创建真实世界的场景。作为数据系统模型, 实体关系模型 开发实体集、关系集、属性和约束。它们经常用于设计关系数据库。

图数据模型 需要确定数据集中的哪些实体应该是指定节点,哪些实体应该是指定链接,以及哪些实体应该被丢弃。 图数据模型 提供数据实体、属性和关系的布局。该过程是重复性的,依赖于反复试验,并且可能很乏味,但值得正确执行。  

面向对象的数据库模型 重点关注与方法和功能相关的数据对象。它包含表格,但不一定限于表格。数据及其关系作为单个实体(数据对象)存储在一起。数据对象代表现实世界的实体。这 面向对象的数据库模型 处理多种格式并用于研究。

关系模型通常称为 SQL,是目前最流行的数据模型。它使用二维表来存储数据和通信关系。某种类型的所有数据都作为表的一部分存储在行中。这些表表示关系,连接它们可以建立存储数据之间的关系。 关系数据库模型 是一个成熟的模型,有大量软件支持,可用于多种用途。

NoSQL 数据模型 不使用行和列,也不真正使用任何类型的集合结构。 他们的开发和设计 通常专注于创建物理数据模型。可扩展性及其特定的怪癖和问题是一个重要的问题。 

对象关系数据库模型 将面向对象的数据库模型与关系数据库模型结合起来。它以与面向对象模型相同的方式存储对象、类、继承等,但也支​​持像关系数据库模型一样的表格结构。 这个设计 允许设计者将其功能合并到表结构中。

数据建模概念的重要性

数据模型就像蓝图,但它们定义数据库或数据系统的关系、实体和属性。一个有组织且设计良好的数据模型对于开发高效的物理数据库和数据系统是必要的。需要充分理解数据建模概念,以消除存储问题和冗余问题,同时支持高效的数据检索。 

数据建模可能是一个挑战,重要的是要认识到每种类型的模型都有其自身的优点和缺点。 

图片经Shutterstock.com许可使用

时间戳记:

更多来自 数据多样性