如何制定成功的灾难恢复策略 - IBM 博客

如何制定成功的灾难恢复策略 – IBM 博客

源节点: 3071296


如何制定成功的灾难恢复策略 – IBM 博客



服务器机房的技术人员

无论您的行业面临地缘政治冲突、全球流行病的影响还是网络安全领域日益加剧的攻击,现代企业面临的威胁无疑是强大的。灾难恢复策略为团队成员提供了在意外事件发生后恢复业务并运行的框架。

在世界范围内,灾难恢复策略的受欢迎程度正在不断增加,这是可以理解的。去年,企业花费了 219 亿美元 网络安全 仅解决方案一项,就比 12 年增长 2022%, 根据国际数据公司(IDC)最近的一份报告 (链接位于 ibm.com 外部)。

灾难恢复策略列出了您的企业将如何应对许多意外事件。强大的灾难恢复策略包括灾难恢复计划(DR 计划)、业务连续性计划(BCP)和事件响应计划(IRP)。这些文件共同帮助确保企业做好应对各种威胁的准备,包括停电、 勒索 和 恶意软件 袭击、自然灾害等等。

什么是灾难恢复计划 (DRP)?

灾难恢复计划 (DRP) 是描述公司如何应对不同类型灾难的详细文件。通常,公司要么自己构建 DRP,要么将其灾难恢复流程外包给第三方 DRP 供应商。与业务连续性计划 (BCP) 和事件响应计划 (IRP) 一起,DRP 在灾难恢复策略的有效性中发挥着关键作用。

什么是业务连续性计划和事件响应计划?

与 DRP 一样,BCP 和 IRP 都是更大的灾难恢复策略的一部分,企业可以依靠该策略在发生灾难时帮助恢复正常运营。 BCP 通常比 DRP 更广泛地审视威胁和解决方案,重点关注公司恢复连接所需的内容。 IRP 是 DRP 的一种,专门关注 网络攻击 以及对 IT 系统的威胁。 IRP 清楚地概述了组织从检测到威胁的那一刻起通过缓解和解决进行的实时紧急响应。 

为什么制定灾难恢复策略很重要

灾难会以不同的方式影响企业,导致各种复杂的问题。从影响物理基础设施和工人安全的地震,到导致无法访问敏感数据存储和客户服务的云服务中断,拥有完善的灾难恢复策略有助于确保企业快速恢复。以下是构建强大的灾难恢复策略的一些最大好处:

  • 保持业务连续性: 业务连续性和 业务连续性灾难恢复 (BCDR) 帮助确保组织在发生意外事件后恢复正常运营,提供数据保护、数据备份和其他关键服务。
  • 降低成本: 根据 IBM 最近的数据泄露成本报告,2023 年数据泄露的平均成本为 4.45 万美元,比过去 15 年增加了 3%。没有制定灾难恢复策略的企业所面临的成本和处罚可能远远超过不投资解决方案所节省的资金。
  • 减少停机时间: 现代企业依赖复杂的技术,例如基于云的基础设施解决方案和蜂窝网络。当意外事件扰乱业务运营时,可能会造成数百万美元的损失。此外,引人注目的网络攻击、长时间停机或人为错误相关的中断可能会导致客户和投资者逃离。
  • 保持合规性: 由于其管理的数据至关重要,在医疗保健和个人金融等受到严格监管的行业运营的企业将因数据泄露而面临巨额罚款和处罚。拥有强大的灾难恢复策略有助于缩短意外事件发生后的响应和恢复流程,这对于经济处罚金额通常与违规持续时间相关的行业至关重要。

灾难恢复策略如何发挥作用

最强大的灾难恢复策略可以帮助企业做好应对各种威胁的准备。用于恢复正常运营的强大模板可以帮助建立投资者和客户的信心,并增加您从企业面临的任何威胁中恢复的可能性。在我们讨论灾难恢复策略的实际组成部分之前,让我们先了解一些关键术语。

  • 故障转移/故障回复: 故障转移是 IT 灾难恢复中广泛使用的过程,当主系统因断电、网络攻击或其他威胁而发生故障时,操作将转移到辅助系统。故障恢复是正常进程恢复后切换回原始系统的过程。例如,企业可以从其故障转移 数据中心 到辅助站点,冗余系统将立即启动。如果执行得当,故障转移/故障回复可以创建无缝体验,用户/客户甚至不知道他们正在被移动到辅助系统。
  • 恢复时间目标 (RTO): RTO 是指在意外事件发生后恢复业务运营所需的时间。建立合理的 RTO 是企业在制定灾难恢复策略时需要做的首要事情之一。  
  • 恢复点目标 (恢复点目标): 您企业的恢复点目标 (RPO) 是指其能够承受丢失但仍能恢复的数据量。一些企业不断地将数据复制到远程数据中心以确保连续性。其他人将可容忍的 RPO 设置为几分钟(甚至几小时),并且知道他们将能够从这段时间内丢失的任何内容中恢复。
  • 灾难恢复即服务 (DRaaS): 博士 由于人们越来越意识到数据安全的重要性,这种灾难恢复方法越来越受欢迎。采用 DRaaS 方法进行灾难恢复的公司实质上是将其灾难恢复计划 (DRP) 外包给第三方。该第三方托管和管理恢复所需的基础设施,然后创建和管理响应计划并确保快速恢复关键业务运营。 根据全球市场洞察 (GMI) 最近的一份报告 (链接位于 ibm.com 外部),11.5 年 DRaaS 的市场规模为 2022 亿美元,并有望在未来几年增长 22%。

创建强大的灾难恢复策略的五个步骤

灾难恢复规划首先对最关键的业务流程进行深入分析,即业务影响分析 (BIA) 和风险评估 (RA)。虽然每个企业都不同并且有独特的要求,但无论您的规模或行业如何,您都可以采取几个步骤来帮助确保有效的灾难恢复规划。

第 1 步:进行业务影响分析

业务影响分析 (BIA) 是对您的公司面临的每一个威胁以及可能的结果的仔细评估。强大的 BIA 着眼于威胁可能如何影响日常运营、沟通渠道、员工安全和业务的其他关键部分。进行 BIA 时需要考虑的一些因素包括收入损失、停机时间的长度和成本、声誉修复成本(公共关系)、客户或投资者信心的丧失(短期和长期)以及您可能因以下原因而面临的任何处罚:因中断而导致的违规行为。

第 2 步:进行风险分析

根据您所在的行业和您经营的业务类型,威胁会有很大差异。进行合理的风险分析 (RA) 是制定策略的关键步骤。您可以通过考虑两件事来单独评估每个潜在威胁——它发生的可能性及其对业务运营的潜在影响。有两种广泛使用的方法:定性和定量风险分析。定性风险分析基于感知风险,定量分析则使用可验证的数据进行。

第 3 步:创建资产清单

灾难恢复依赖于对企业拥有的每项资产的全面了解。这包括硬件、软件、IT 基础设施、数据以及对您的业务运营至关重要的任何其他内容。以下是三个广泛使用的标签,用于对资产进行分类:

  • 危急: 仅标记资产 危急 如果正常业务运营需要它们。
  • 重要提示: 将此标签分配给您的企业每天至少使用一次的资产,如果中断,将会对业务运营产生影响(但不会完全关闭它们)。
  • 不重要: 这些是您的企业不经常使用的资产,对于正常业务运营而言并非必需。

第 4 步:建立角色和职责 

明确分配角色和职责可以说是灾难恢复策略中最重要的部分。没有它,没有人知道在发生灾难时该怎么办。虽然实际的角色和职责根据公司规模、行业和业务类型的不同而有很大差异,但每个恢复策略都应包含一些角色和职责:

  • 事件记者: 负责在发生破坏性事件时与利益相关者和相关当局沟通并维护所有相关方的最新联系信息的个人。
  • 灾难恢复计划经理: 您的 DRP 经理确保灾难恢复团队成员执行分配给他们的任务,并确保您制定的策略顺利运行。 
  • 资产管理人: 您应该指派某人在灾难发生时负责保护关键资产,并在整个事件过程中报告他们的状态。

第 5 步:测试和完善

为了确保您的灾难恢复策略是合理的,您需要不断练习并根据任何有意义的变化定期更新。例如,如果您的公司在制定 DRP 战略后收购了新资产,则需要将它们纳入您的计划中,以确保它们在未来受到保护。灾难恢复策略的测试和完善可以分为三个简单的步骤:

  1. 创建精确的模拟: 在演练您的 DRP 时,请尝试创建一个尽可能接近您公司将面临的实际场景的环境,而不会让任何人面临人身风险。
  2. 识别问题: 使用 DRP 测试流程来识别计划中的错误和不一致之处,简化流程并解决备份过程中的任何问题。
  3. 测试您的灾难恢复程序: 了解如何应对事件至关重要,但在事件结束后测试为恢复关键系统而制定的程序也同样重要。测试如何重新打开网络、恢复所有丢失的数据并恢复正常的业务运营。 

灾难恢复解决方案

现代企业比以往任何时候都更加依赖技术来服务客户。即使是轻微的中断也可能导致严重的停机并影响客户和投资者的信心。 IBM FlashSystem 网络恢复保证专为购买具有 IBM Storage 专家服务和 IBM Storage Insights Pro 的新 FlashSystem 阵列的任何人而设计。

使用 IBM FlashSystem 探索网络弹性

本文是否有帮助?

是的没有


更多来自云




密码学用例:从安全通信到数据安全 

6 阅读分钟在数据安全方面,古老的密码学艺术已成为当今数字时代的重要基石。从绝密的政府情报到日常的个人信息,密码学可以使我们最敏感的信息不被不受欢迎的旁观者掩盖。无论是在线购物还是将有价值的商业秘密保存到磁盘上,我们都可以感谢密码学为我们提供的任何表面上的隐私。密码学的主要原理是在网上开展业务时建立信任。它们包括以下内容: 机密性:加密……




利用 AWS 上的 Green IT Analyzer 加速可持续现代化

11 阅读分钟企业越来越多地接受数据密集型工作负载,包括高性能计算、人工智能 (AI) 和机器学习 (ML)。这些技术推动混合、多云之旅的创新,同时关注弹性、性能、安全性和合规性。公司还努力平衡这种创新与不断增长的环境、社会和治理 (ESG) 法规。对于大多数组织而言,IT 运营和现代化是其 ESG 目标的一部分,根据 Foundry 最近的一项调查,大约 60% 的组织寻求专门从事绿色环保的服务提供商……




引入 IBM Cloud File Storage for VPC 的跨区域复制

4 阅读分钟在不断发展的云计算领域,企业越来越依赖云文件存储解决方案来确保可访问性、可扩展性和数据安全性。优化云存储策略的一个重要方面是复制,它通过为所有文件共享提供无缝、异步复制来帮助您实现业务连续性、灾难恢复、数据迁移和扩展,从而为您的数据添加额外的冗余层。了解复制 复制是跨多个存储位置复制数据的过程……




Jamworks 如何在集成 AI 优势的同时保护机密性

6 阅读分钟人工智能 (AI) 的融合开创了技术进步的新时代,为各行业带来了一系列好处。人工智能彻底改变运营、增强决策和推动创新的潜力是不可否认的。人工智能的优势众多且影响深远,从改进策略的预测分析,到促进客户互动并协助用户完成日常任务的自然语言处理,再到增强残疾人的可访问性、沟通和独立性的辅助工具。 “人工智能正在推动……

IBM 时事通讯

获取我们的时事通讯和主题更新,提供最新的思想领导力和对新兴趋势的见解。

现在订阅

更多新闻通讯

时间戳记:

更多来自 IBM