近年来,自助仓储单位激增。这些大型仓库单位在全国范围内兴起,成为一个蓬勃发展的行业,原因有一个:普通人现在拥有的财产多得不知道该如何处理。
同样的基本情况也困扰着 IT 领域。我们正处于数据爆炸之中。即使是相对简单的日常物品现在也会定期自行生成数据,这要归功于 物联网(IOT) 功能。历史上从未有过如此多的数据被创建、收集和分析。前所未有的数据管理者面临如何存储如此多数据的问题。
公司最初可能无法认识到问题或问题会变得有多大,然后该公司必须找到增加存储的解决方案。随着时间的推移,公司的发展也可能会超出该存储系统的容量,从而需要更多的投资。不可避免地,该公司会厌倦这个游戏,并会寻求一种更便宜、更简单的选择——这让我们 重复数据删除.
尽管许多组织将重复数据删除技术(或“重复数据删除”)作为其数据管理系统的一部分,但真正了解重复数据删除过程是什么及其用途的人却很少。那么,让我们揭开重复数据删除的神秘面纱并解释重复数据删除的工作原理。
重复数据删除有什么作用?
首先,让我们澄清我们的主要术语。重复数据删除是组织用来简化数据持有并通过消除冗余数据副本来减少归档数据量的流程。
此外,我们应该指出,当我们谈论冗余数据时,我们实际上是在文件级别上谈论,指的是数据文件的猖獗扩散。因此,当我们讨论重复数据删除工作时,实际上需要一个文件重复删除系统。
重复数据删除的主要目标是什么?
有些人对数据的本质抱有错误的观念,将其视为一种商品,只是为了收集和收获而存在的,就像你家后院树上的苹果一样。
现实情况是,每个新数据文件都需要花钱。首先,获取这些数据通常需要花钱(通过购买数据列表)。或者,组织需要大量的财务投资才能自行收集和收集数据,即使这些数据是组织本身有机生产和收集的。因此,数据集是一项投资,就像任何有价值的投资一样,必须严格保护它们。
在这种情况下,我们讨论的是数据存储空间——无论是本地硬件服务器的形式还是通过 云存储 通过基于云的 数据中心——必须购买或租赁。
因此,经过复制的数据的重复副本会带来超出与主存储系统及其存储空间相关的额外存储成本,从而损害底线。简而言之,必须投入更多的存储介质资产来容纳新数据和已存储的数据。在公司发展轨迹的某个时刻,重复数据很容易成为一种财务负债。
因此,总而言之,重复数据删除的主要目标是通过使组织能够减少额外存储上的支出来节省资金。
重复数据删除的其他好处
除了存储容量之外,公司采用重复数据删除解决方案还有其他原因——可能最重要的莫过于它们提供的数据保护和增强功能。组织可以细化和优化重复数据删除的数据工作负载,以便它们比充满重复文件的数据更有效地运行。
重复数据删除的另一个重要方面是它如何帮助实现快速、成功的 灾害 恢复工作并最大限度地减少此类事件通常导致的数据丢失量。重复数据删除有助于实现强大的备份过程,因此组织的备份系统相当于处理其备份数据的任务。除了帮助进行完整备份之外,重复数据删除还有助于保留工作。
重复数据删除的另一个好处是它与 虚拟桌面基础架构 (VDI) 部署,这要归功于 VDI 远程桌面背后的虚拟硬盘运行相同。受欢迎的 桌面即服务 (DaaS) 产品包括 Microsoft 的 Azure 虚拟桌面及其 Windows VDI。这些产品创造 虚拟机 (VM),它们是在服务器虚拟化过程中创建的。反过来,这些虚拟机又为 VDI 技术提供了支持。
重复数据删除方法
最常用的重复数据删除形式是块重复数据删除。该方法通过使用自动化功能来识别数据块中的重复项,然后删除这些重复项。通过在此块级别工作,可以分析独特数据块并将其指定为值得验证和保存的数据。然后,当重复数据删除软件检测到同一数据块的重复时,该重复被删除,并且对原始数据的引用被包含在其位置中。
这是重复数据删除的主要形式,但并不是唯一的方法。在其他用例中,重复数据删除的替代方法在文件级别运行。单实例存储比较文件服务器内数据的完整副本,但不比较数据块或数据块。与其对应方法一样,文件重复数据删除取决于将原始文件保留在文件系统中并删除额外的副本。
应该注意的是,重复数据删除技术的工作方式与数据压缩算法(例如,LZ77、LZ78)并不完全相同,尽管两者确实都追求减少数据冗余的相同总体目标。与压缩算法相比,重复数据删除技术在更大的宏观范围内实现了这一目标,压缩算法的目标不是用共享副本替换相同的文件,而是更有效地编码数据冗余。
重复数据删除的类型
重复数据删除有不同类型,具体取决于 ,尤其是 重复数据删除过程发生:
- 内联重复数据删除: 这种形式的重复数据删除是在数据在存储系统内流动时实时发生的。内联重复数据删除系统传输的数据流量较少,因为它既不传输也不存储重复数据。这可能会导致该组织所需的带宽总量减少。
- 后处理重复数据删除: 这种类型的重复数据删除发生在数据被写入并放置在某种类型的存储设备上之后。
这里值得解释的是,这两种类型的重复数据删除都受到重复数据删除固有的哈希计算的影响。这些 加密 计算对于识别数据中的重复模式至关重要。在在线重复数据删除过程中,这些计算是即时执行的,这可能会主导并暂时压倒计算机功能。在后处理重复数据删除中,可以在以某种方式添加数据后的任何时间执行哈希计算,并且不会对组织的计算机资源造成过度负担。
重复数据删除类型之间的细微差别还不止于此。对重复数据删除类型进行分类的另一种方法是基于 哪里 这样的过程就会发生。
- 源重复数据删除: 这种形式的重复数据删除发生在新数据实际生成的地方附近。系统扫描该区域并检测文件的新副本,然后将其删除。
- 目标重复数据删除: 另一种类型的重复数据删除类似于源重复数据删除的反转。在目标重复数据删除中,系统会对在创建原始数据的区域以外的区域中找到的任何副本进行重复数据删除。
由于重复数据删除的实施方式有多种,具有前瞻性的组织必须对所选择的重复数据删除类型做出仔细、深思熟虑的决定,并根据公司的特定需求平衡该方法。
在许多用例中,组织选择的重复数据删除方法很可能取决于各种内部变量,例如:
- 正在创建多少数据集以及什么类型的数据集
- 组织的主存储系统
- 正在使用哪些虚拟环境
- 公司依赖哪些应用程序
重复数据删除的最新发展
与所有计算机输出一样,重复数据删除将越来越多地利用 人工智能(AI) 随着它的不断发展。重复数据删除将变得越来越复杂,因为它会产生更多细微差别,帮助它在扫描数据块时寻找冗余模式。
重复数据删除的一个新兴趋势是强化学习。这使用奖励和惩罚系统(如强化训练),并应用最佳策略来分离记录或合并记录。
另一个值得关注的趋势是使用集成方法,其中串联使用不同的模型或算法以确保重复数据删除过程中更高的准确性。
持续的困境
IT 世界越来越关注持续存在的数据激增问题及其应对措施。许多公司发现自己处于一个尴尬的境地,既希望保留他们努力积累的所有数据,又希望将溢出的新数据存储在任何可能的存储容器中,哪怕只是为了将其移开。
尽管这种困境仍然存在,但随着组织将重复数据删除视为购买更多存储的更便宜的替代方案,对重复数据删除工作的重视将继续下去。因为归根结底,虽然我们直观地理解业务需要数据,但我们也知道数据通常需要重复数据删除。
了解 IBM Storage FlashSystem 如何帮助您满足存储需求
本文是否有帮助?
有没有
IBM 时事通讯
获取我们的时事通讯和主题更新,提供最新的思想领导力和对新兴趋势的见解。
现在订阅
更多新闻通讯
- :具有
- :是
- :不是
- :在哪里
- $UP
- 1
- 17
- 19
- 2022
- 2024
- 22
- 28
- 29
- 30
- 300
- 36
- 400
- 41
- 7
- 84
- 9
- 91
- a
- Able
- 关于
- 关于它
- 容纳
- 根据
- 通
- 添加
- 增加
- 额外
- 高级
- 广告
- 影响
- 后
- 驳
- AI
- 艾滋病
- 瞄准
- 算法
- 所有类型
- 单
- 还
- 替代
- 尽管
- 量
- amp
- an
- 分析
- 分析
- 和
- 最新公告
- 另一个
- 任何
- 适用
- 应用
- 保健
- 国家 / 地区
- 地区
- 刊文
- AS
- 方面
- 办公室文员:
- 协助
- 相关
- At
- 作者
- 自动化
- Azure
- 背部
- 背景
- 备份工具
- 备份
- 平衡
- 带宽
- 基于
- 基本包
- BE
- 因为
- 成为
- 成为
- 很
- before
- 背后
- 作为
- 得益
- 好处
- 之间
- 超越
- 亿
- 阻止
- 吹氣梢
- 博客
- 博客
- 蓝色
- 都
- 半身裙/裤
- 带来
- 预算
- 建立
- 商业
- 业务连续性
- 企业
- 但是
- 按键
- by
- CAN
- 容量
- 资本
- 碳
- 卡
- 牌
- 小心
- 携带
- 例
- 喵星人
- 产品类别
- 椅子
- 挑战
- 挑战
- 渠道
- 便宜
- 查
- 选择
- 选择
- 选择
- 界
- CIS
- 程
- 分类
- 密切
- 云端技术
- 云计算
- 收藏
- 颜色
- 如何
- 购买的订单均
- 商品
- 常用
- 公司
- 公司
- 公司的
- 一台
- 计算
- 结合
- 考虑
- 考虑
- 容器
- 继续
- 继续
- 连续性
- 副本
- 成本
- 对口
- 覆盖
- 创建信息图
- 创建
- 交叉
- 的CSS
- 习俗
- 网络安全
- 达斯
- data
- 数据丢失
- 数据管理
- 数据保护
- 数据集
- 数据存储
- 日期
- 决定
- 默认
- 定义
- 交付
- 揭开神秘面纱
- 根据
- 依靠
- 部署
- 描述
- 设计
- 通过电脑捐款
- 详细
- 发展
- 设备
- 差异
- 不同
- 灾害
- 讨论
- do
- 不
- 不会
- 主宰
- 别
- 向下
- ,我们将参加
- e
- 每
- 容易
- 有效
- 努力
- 工作的影响。
- 消除
- 拥抱
- 新兴经济体的新市场。
- 重点
- 授权
- enable
- 使
- 编码
- 结束
- 增强
- 确保
- 输入
- 企业
- 企业
- 环境中
- 插曲
- 等于
- 必要
- 醚(ETH)
- 甚至
- 活动
- 所有的
- 日常
- 发展
- 存在
- Exit 退出
- 说明
- 说明
- 爆炸
- 额外
- 面部彩妆
- 面孔
- 事实
- 工厂
- 失败
- 余波
- false
- 特色
- 文件
- 档
- 金融
- 找到最适合您的地方
- 寻找
- 姓氏:
- 流动
- 专注焦点
- 遵循
- 以下
- 字体
- 针对
- 申请
- 发现
- 骨架
- 止
- ,
- 功能
- 功能
- 游戏
- 收集
- 云集
- 其他咨询
- 生成
- 产生
- 发电机
- 地缘政治
- 得到
- 眼镜
- 全球
- 全球流行病
- 目标
- 更大的
- 最大的
- 绿色
- 格
- 增长
- 手
- 处理
- 硬
- 硬件
- 哈希
- 有
- 标题
- 高度
- 帮助
- 有帮助
- 帮助
- 帮助
- 历史
- 控股
- 创新中心
- How To
- HTTPS
- IBM
- IBM Cloud
- 首次代币发行
- ICON
- 相同
- 鉴定
- 确定
- if
- 图片
- 重要
- 重要方面
- 威风
- in
- 其他
- 事故
- 包括
- 包括
- 增加
- 增加
- 增加
- 日益
- 指数
- 行业中的应用:
- 必将
- 基础设施
- 固有
- 原来
- 可行的洞见
- 例
- 代替
- 积分
- 房源搜索
- 拟
- 内部
- 反转
- 投资
- 物联网
- 问题
- IT
- 它的
- 本身
- 一月
- JPG
- 保持
- 键
- 知道
- 笔记本电脑
- 大
- 大
- 名:
- 去年
- 最新
- 铅
- 领导团队
- 学习
- 减
- Level
- 责任
- 喜欢
- Line
- 书单
- 本地
- 当地
- 离
- 机
- 宏
- 主要
- 使
- 男子
- 颠覆性技术
- 管理系统
- 经理
- 方式
- 许多
- 最大宽度
- 可能..
- 媒体
- 成员
- 合并
- 方法
- 方法
- 微软
- 可能
- 分钟
- 大幅减低
- 最小化
- 分钟
- 联络号码
- 模型
- 现代
- 时刻
- 钱
- 更多
- 最先进的
- 许多
- 必须
- 国内
- 自然
- 旅游导航
- 近
- 几乎
- 打印车票
- 需要
- 也不
- 决不要
- 全新
- 消息
- 新闻简报
- 不包含
- 也不
- 注意到
- 没什么
- 概念
- 现在
- 细微之处
- 对象
- 获得
- 发生
- of
- 折扣
- 经常
- on
- 一
- 正在进行
- 仅由
- 打开
- 操作
- 运营
- 运营
- 最佳
- 优化
- 优化
- 附加选项
- or
- 有机地
- 组织
- 组织
- 原版的
- 其他名称
- 我们的
- 输出
- 大纲
- 产量
- 己
- 页
- 流感大流行
- 部分
- 特别
- 模式
- 付款
- 国家
- 处罚
- 员工
- 执行
- 仍然存在
- 人
- PHP
- 地方
- 放置
- 瘟疫
- 计划
- 规划行程
- 计划
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 插上
- 插入
- 点
- 准备
- 政策
- 热门
- 声望
- 位置
- 财产
- 可能
- 帖子
- 后处理
- 鲍威尔
- 强大
- 可预见
- Prepare
- 保存
- 小学
- 市场问题
- 过程
- 过程
- 生产
- 热销产品
- 保护
- 保护
- 提供
- 供应商
- 出版
- 采购
- 购买
- 购买
- 追求
- 追求
- 相当
- RE
- 阅读
- 现实
- 原因
- 最近
- 承认
- 记录
- 恢复
- 减少
- 减少
- 减少
- 减少
- 参考
- 提炼
- 关于
- 强化学习
- 有关
- 相对
- 依靠
- 远程
- 去掉
- 去除
- 删除
- 重复
- 复制
- 报告
- 需要
- 资源
- 响应
- 导致
- 保留
- 保留
- 回报
- 奖励
- 右
- 上升
- 风险
- 变更管理
- 路线图
- 机器人
- Room
- 常规
- 运行
- 运行
- 同
- 保存
- 鳞片
- 扫描
- 屏风
- 脚本
- 看到
- 寻找
- 搜索引擎优化
- 分离
- 系列
- 服务器
- 服务器
- 服务
- 套数
- 共用的,
- 转移
- 短
- 射击
- 应该
- 简易
- 简单
- 只是
- 同时
- 网站
- 坐在
- 情况
- 小
- So
- 软件
- 方案,
- 解决方案
- 一些
- 极致
- 来源
- 太空
- 说话
- 发言
- 具体的
- 指定
- 花
- 花费
- 花费
- 赞助商
- 广场
- 开始
- 留
- 步骤
- 棒
- 存储
- 商店
- 商店
- 策略
- 策略
- 精简
- 粗壮
- 订阅
- 大量
- 成功
- 这样
- 总和
- 肯定
- SVG的
- 系统
- 采取
- 需要
- 服用
- 说
- 串联
- 目标
- 任务
- 团队
- 团队成员
- 科技
- 技术
- 专业技术
- 术语
- 条款
- 第三
- 比
- 谢谢
- 这
- 世界
- 其
- 他们
- 主题
- 他们自己
- 然后
- 那里。
- 因此
- 博曼
- 他们
- 事
- 认为
- Free Introduction
- 那些
- 思想
- 精神领袖
- 威胁
- 通过
- 始终
- 收紧
- 次
- 胎
- 标题
- 至
- 最佳
- 主题
- Topics
- 合计
- 交通
- 产品培训
- 轨道
- 转让
- 树
- 趋势
- 趋势
- true
- 真正
- 转
- 类型
- 类型
- 最终
- 不可否认
- 经历
- 理解
- 可以理解
- 意外
- 独特
- 单位
- 最新动态
- 上
- 网址
- us
- USD
- 使用
- 用过的
- 使用
- 运用
- 平时
- 验证
- 有价值
- 各种
- 非常
- 通过
- 视频
- 查看
- 在线会议
- 虚拟桌面
- vs
- W
- 希望
- 仓库保管
- 是
- 观看
- 方法..
- we
- 卷筒纸
- 井
- 什么是
- ,尤其是
- 这
- 而
- 谁的
- 将
- 窗户
- 中
- 目击
- WordPress
- 工作
- 工作
- 加工
- 合作
- 世界
- 全世界
- 价值
- 值得
- 书面
- 年
- 年
- 您
- 您一站式解决方案
- YouTube的
- 和风网