为什么下一代数据管理始于数据结构

源节点: 800232

单击以了解有关作者的更多信息 肯德尔·克拉克(Kendall Clark)。

IT 交付业务价值的使命从未如此强烈。实际上, 76%的高管 相信 IT 必须成为制定业务战略的积极合作伙伴。敏捷性是这里成功的关键。然而,大多数企业都受到数据策略的阻碍,当市场发生变化或出现新挑战时,数据策略会让团队措手不及。

以结构化数据管理系统为例。当企业数据环境本身主要是结构化时,此选项效果很好。但现在的世界不同了,企业数据格局现在由混合、多样化和不断变化的数据主导。物联网 (IoT) 的出现、非结构化数据量的增加、外部数据源相关性的增加以及混合多云环境的趋势都是满足每个新数据请求的障碍。这 旧数据策略以关系数据系统为中心的 ,已经从根本上被破坏了。那么,企业如何从被动数据战略转向响应式数据战略呢?

企业数据结构:前进的道路

今天的组织正在寻求建立一个 数据结构 为协作、跨职能项目和产品提供支持,并通过弹性数字基础摆脱被动工作流程——无需拆除和更换。数据结构将来自内部数据孤岛和外部来源的数据编织在一起,并创建一个信息网络来为应用程序、人工智能和分析提供支持。很简单,它们支持当今复杂的互联企业中的全方位数据挑战。

与旧的静态数据集成技术不同,数据结构的关键原则是它们可以:

  • 回答意外问题并适应新要求
  • 赋予数据意义,从而获得更好的洞察力
  • 无论数据结构如何,都可以跨数据孤岛和外部源进行查询
  • 对现有系统进行现代化改造,无需拆除和更换
  • 在计算层连接数据,而不是在存储层连接数据,这样就可以连接数据孤岛,而无需创建额外的孤岛

数据结构还支持跨职能数据连接,这对于创建和捍卫竞争优势以及实现整个企业以及与外部合作伙伴的协作至关重要。以供应链创新的挑战为例。传统的供应链数据系统是一场接力赛,通过线性交接和系统之间孤立的点对点链接来运行。当 COVID-19 袭来、全球供应链崩溃时,我们看到了可预见的结果。一些压力甚至部分崩溃是不可避免的,但由于数据策略不足,将供应链视为僵化系统,结果变得更糟。事实上,供应链是一个复杂的参与者网络,必须完全同步才能根据需要进行调整。

借助由数据结构支持的数字供应网络,企业可以回答他们以前忽视的复杂问题,例如“向我展示参与成品批次 123 生产的所有原材料批次和相关供应商”。或者“这两个地区的产品 A 的销货成本如何比较?”或者“此次客诉涉及的原材料是哪些厂家提供的?”

将成功的 Data Fabric 拼接在一起首先要了解其材料

与其他方法不同,数据结构将现有的数据管理系统和应用程序编织在一起。因此,数据结构很快被视为数据集成领域成熟的下一步也就不足为奇了。发生这种情况是因为数据结构可以:

1. 揭示隐藏的含义: 数据结构通过在整个企业中传递意义而不仅仅是数据来改变现状。这种含义由许多来源交织在一起:数据和元数据、内部和外部来源以及云和本地系统。意义是在可扩展的知识图驱动的数据模型中捕获的,每个数据资产的所有上下文都以机器可理解的形式完全呈现和可用。借助数据结构,人们和算法可以做出更好的决策,同时还可以降低数据滥用或误解的可能性和风险。

2. 回答棘手的问题: 数据结构通过强大的查询、搜索和学习功能提供答案。数据结构平台不是基于移动或复制数据的静态实体,而是提供动态的“可查询”数据层,从各个方面收集答案 数据孤岛。以前的数据集成策略依赖于创建新的数据模型来支持每个新用例,然后移动或复制数据以填充该数据模型。借助数据结构,数据模型是可重用的,因此当出现意外问题时,团队可以轻松进行调整以满足业务需求。

3. 支持跨职能数据管理项目: 数据结构将现有的数据管理系统编织在一起,丰富了所有连接的应用程序。它们取代了收集或编目企业资产但未能使数据可用的旧系统。以前的解决方案也失败了,部分原因是它们无法处理混合、多样化和不断变化的数据,而且还由于组织的阻力。然而,数据结构是为了协作、利用和连接现有资产以及推动新型跨职能数据管理项目而构建的。

现有投资现代化

我们大多数人都会记得数据湖曾经如何实现集中企业数据资产的承诺。但许多数据湖未能兑现其炒作,正是因为它们在存储层配置数据,而不是在计算层连接数据。他们根据数据的位置而不是其业务含义来利用数据。数据结构背后的整个前提是数据的物理配置本身并不完成数据连接或提供含义或上下文。事实上,老一代基于存储的集成系统(例如数据仓库)的能力甚至不如数据湖,因为它们一开始只能轻松管理结构化数据,而半结构化和非结构化数据孤岛完全没有得到解决和断开连接。公司迅速转向数据目录,试图解决其数据环境令人眼花缭乱的多样性,结果却发现仅靠编目并不能带来互联企业。

虽然这些技术有望消除数据孤岛,但事实是它们是不可避免的,并且存在的理由非常充分。当对业务的特定部分很重要时,它们允许本地控制和治理,因为某些数据必须与其他数据分开存储,以符合法律法规或仅仅是出于遗留业务原因。传统的数据集成侧重于消除
通过掌握、迁移、整合或治理来消除孤岛。但数据结构提供了一种实用的替代方案。数据结构不是针对数据孤岛,而是利用它们而不需要进一步的数据副本。数据结构不是取代传统技术,而是与现有投资一起工作并提高其效用。这是因为数据结构是一种在计算层运行的架构设计,专注于连接数据(无论数据位于何处),从而实际上改进了现有的物理整合数据存储资产,例如数据湖、数据目录、仓库、MDM 等。

知识图:成功的数据结构所缺少的一针

知识图能够代表企业数据的全部多样性和复杂性,因为它们作为通用的意义格式,无论数据的源结构、位置或格式如何。知识图谱取代了当前集成企业数据的繁琐过程,该过程通常涉及提取、翻译、建模、映射,然后 移动 各种应用程序之间的数据。建模和映射所需的自定义代码很快就会变得难以处理,从而减慢了创新和洞察的步伐。

知识图是有效数据结构的一个组成部分,因为它们创建了可重用的知识网络,并轻松表示各种结构的数据并支持多种模式。知识图创建对企业和第三方数据的可查询、可重用的语义理解,作为数据结构的核心:丰富和加速现有投资并提供对业务洞察的关键访问。

就像符合其所包含的内容的普通结构一样,企业数据结构位于现有数据资产之上,并通过单独的线程连接到它们,并将这些源编织到一个统一的层中。通过这样做,数据结构实际上复合了现有投资的业务价值。

资料来源:https://www.dataversity.net/why-the-next- Generation-of-data-management-begins-with-data-fabrics/

时间戳记:

更多来自 数据多样性