Как разработать успешную стратегию аварийного восстановления - Блог IBM

Как построить успешную стратегию аварийного восстановления – блог IBM

Исходный узел: 3071297


Как построить успешную стратегию аварийного восстановления – блог IBM



Техник в серверную комнату

Независимо от того, сталкивается ли ваша отрасль с проблемами геополитической борьбы, последствиями глобальной пандемии или растущей агрессией в сфере кибербезопасности, вектор угроз для современных предприятий, несомненно, является мощным. Стратегии аварийного восстановления предоставляют членам команды основу для восстановления работоспособности бизнеса после незапланированного события.

Понятно, что во всем мире популярность стратегий аварийного восстановления растет. В прошлом году компании потратили 219 миллиардов долларов США на информационной безопасности и только решения, что на 12% больше, чем в 2022 году, согласно недавнему отчету Международной корпорации данных (IDC) (ссылка находится за пределами ibm.com).

Стратегия аварийного восстановления определяет, как ваш бизнес будет реагировать на ряд незапланированных инцидентов. Надежные стратегии аварийного восстановления включают планы аварийного восстановления (планы аварийного восстановления), планы обеспечения непрерывности бизнеса (BCP) и планы реагирования на инциденты (IRP). Вместе эти документы помогают обеспечить готовность предприятий к столкновению с различными угрозами, включая перебои в подаче электроэнергии, вымогателей и вредоносных программ нападения, стихийные бедствия и многое другое.

Что такое план аварийного восстановления (DRP)?

Планы аварийного восстановления (DRP) представляют собой подробные документы, описывающие, как компании будут реагировать на различные типы стихийных бедствий. Обычно компании либо создают DRP самостоятельно, либо передают процесс аварийного восстановления стороннему поставщику DRP. Наряду с планами обеспечения непрерывности бизнеса (BCP) и планами реагирования на инциденты (IRP), DRP играют решающую роль в эффективности стратегии аварийного восстановления.

Что такое планы обеспечения непрерывности бизнеса и планы реагирования на инциденты?

Как и DRP, BCP и IRP являются частью более широкой стратегии аварийного восстановления, на которую бизнес может положиться, чтобы помочь восстановить нормальную работу в случае катастрофы. BCP обычно более широко рассматривают угрозы и варианты устранения, чем DRP, уделяя особое внимание тому, что необходимо компании для восстановления связи. IRP – это тип DRP , который фокусируется исключительно на кибератаки и угрозы для ИТ-систем. IRP четко описывают реагирование организации на чрезвычайные ситуации в режиме реального времени с момента обнаружения угрозы посредством ее смягчения и устранения. 

Почему важно иметь стратегию аварийного восстановления

Бедствия могут по-разному влиять на бизнес, вызывая всевозможные сложные проблемы. От землетрясения, которое влияет на физическую инфраструктуру и безопасность работников, до сбоя облачных служб, который закрывает доступ к хранению конфиденциальных данных и обслуживанию клиентов, наличие продуманной стратегии аварийного восстановления помогает обеспечить быстрое восстановление бизнеса. Вот некоторые из наиболее важных преимуществ построения эффективной стратегии аварийного восстановления:

  • Обеспечение непрерывности бизнеса: Непрерывность бизнеса и Аварийное восстановление непрерывности бизнеса (BCDR) помогают организациям вернуться к нормальной работе после незапланированного события, обеспечивая защиту данных, резервное копирование данных и другие критически важные услуги.
  • Снижение затрат: По  Недавний отчет IBM о стоимости утечки данныхСредняя стоимость утечки данных в 2023 году составила 4.45 миллиона долларов США, что на 15% больше, чем за последние 3 года. Предприятия, у которых нет стратегий аварийного восстановления, рискуют затратами и штрафами, которые могут значительно перевесить деньги, сэкономленные в результате отказа от инвестиций в решение.
  • Сокращение простоев: Современные предприятия полагаются на сложные технологии, такие как облачные инфраструктурные решения и сотовые сети. Когда незапланированный инцидент нарушает работу бизнеса, он может стоить миллионы. Кроме того, громкий характер кибератак, длительные простои или перебои, связанные с человеческим фактором, могут привести к бегству клиентов и инвесторов.
  • Соблюдение требований: Предприятия, которые работают в жестко регулируемых секторах, таких как здравоохранение и личные финансы, сталкиваются с крупными штрафами и штрафами за утечку данных из-за критического характера данных, которыми они управляют. Наличие сильной стратегии аварийного восстановления помогает сократить процессы реагирования и восстановления после незапланированного инцидента, что имеет решающее значение в секторах, где сумма финансовых штрафов часто привязана к продолжительности нарушения.

Как работают стратегии аварийного восстановления

Самые эффективные стратегии аварийного восстановления подготавливают предприятия к столкновению с широким спектром угроз. Надежный шаблон для восстановления нормальной работы может помочь завоевать доверие инвесторов и клиентов, а также повысить вероятность того, что вы оправитесь от любых угроз, с которыми сталкивается ваш бизнес. Прежде чем мы перейдем к реальным компонентам стратегий аварийного восстановления, давайте рассмотрим несколько ключевых терминов.

  • Failover/возврат: Аварийное переключение – это широко используемый процесс аварийного восстановления ИТ, при котором операции переносятся на вторичную систему, когда основная система выходит из строя из-за отключения питания, кибератаки или другой угрозы. Возврат к сбою — это процесс возврата к исходной системе после восстановления нормальных процессов. Например, предприятие может выполнить аварийное переключение со своего центр обработки данных на вторичный объект, где мгновенно заработает резервная система. При правильном выполнении аварийное переключение/восстановление может обеспечить бесперебойную работу, при которой пользователь/клиент даже не подозревает, что его перемещают на дополнительную систему.
  • Целевое время восстановления (РТО): RTO относится к количеству времени, которое требуется для восстановления бизнес-операций после незапланированного инцидента. Установление разумного RTO — это одно из первых действий, которые необходимо сделать предприятиям при разработке стратегии аварийного восстановления.  
  • Цель точки восстановления (РПО): RPO вашего бизнеса – это объем данных, которые он может позволить себе потерять и при этом восстановить. Некоторые предприятия постоянно копируют данные в удаленный центр обработки данных, чтобы обеспечить непрерывность. Другие устанавливают допустимую RPO в несколько минут (или даже часов) и знают, что смогут восстановить все, что было потеряно за это время.
  • Аварийное восстановление как услуга (DRaaS): DRaaS — это подход к аварийному восстановлению, который набирает популярность благодаря растущему осознанию важности безопасности данных. Компании, которые используют подход DRaaS к аварийному восстановлению, по сути, передают свои планы аварийного восстановления (DRP) третьей стороне. Эта третья сторона размещает и управляет необходимой инфраструктурой для восстановления, затем создает планы реагирования и управляет ими, а также обеспечивает быстрое возобновление критически важных для бизнеса операций. Согласно недавнему отчету Global Market Insights (GMI) (ссылка находится за пределами сайта ibm.com), размер рынка DRaaS в 11.5 году составил 2022 миллиардов долларов США и в предстоящие годы должен был вырасти на 22%.

Пять шагов к созданию эффективной стратегии аварийного восстановления

Планирование аварийного восстановления начинается с глубокого анализа наиболее важных бизнес-процессов, известного как анализ влияния на бизнес (BIA) и оценка рисков (RA). Хотя каждый бизнес уникален и имеет уникальные требования, независимо от размера или отрасли вы можете предпринять несколько шагов, которые помогут обеспечить эффективное планирование аварийного восстановления.

Шаг 1. Проведите анализ влияния на бизнес

Анализ воздействия на бизнес (BIA) – это тщательная оценка каждой угрозы, с которой сталкивается ваша компания, а также возможных последствий. Strong BIA анализирует, как угрозы могут повлиять на повседневную деятельность, каналы связи, безопасность сотрудников и другие важные части вашего бизнеса. Примеры нескольких факторов, которые следует учитывать при проведении BIA, включают потерю дохода, продолжительность и стоимость простоя, стоимость восстановления репутации (связи с общественностью), потерю доверия клиентов или инвесторов (краткосрочную и долгосрочную перспективу), а также любые штрафы, с которыми вы можете столкнуться из-за того, что нарушений комплаенса, вызванных перерывом в работе.

Шаг 2. Проведите анализ рисков

Угрозы сильно различаются в зависимости от вашей отрасли и типа бизнеса, которым вы управляете. Проведение тщательного анализа рисков (RA) является важным шагом в разработке вашей стратегии. Вы можете оценить каждую потенциальную угрозу отдельно, приняв во внимание две вещи: вероятность ее возникновения и ее потенциальное влияние на бизнес-операции. Для этого широко используются два метода: качественный и количественный анализ рисков. Качественный анализ риска основан на предполагаемом риске, а количественный анализ проводится с использованием поддающихся проверке данных.

Шаг 3. Создайте инвентаризацию активов

Аварийное восстановление основано на наличии полной картины каждого актива, которым владеет ваше предприятие. Сюда входят оборудование, программное обеспечение, ИТ-инфраструктура, данные и все остальное, что имеет решающее значение для операций вашего бизнеса. Вот три широко используемых ярлыка для классификации ваших активов:

  • Критический: Отмечайте только объекты критической если они необходимы для обычных деловых операций.
  • важно: Присвойте этот ярлык активам, которые ваша компания использует хотя бы раз в день, и в случае сбоя это повлияет на бизнес-операции (но не отключит их полностью).
  • Неважно: Это активы, которые ваш бизнес использует нечасто и которые не являются необходимыми для нормальной деловой деятельности.

Шаг 4. Определите роли и обязанности 

Четкое распределение ролей и обязанностей, возможно, является наиболее важной частью стратегии аварийного восстановления. Без него никто не будет знать, что делать в случае катастрофы. Хотя фактические роли и обязанности сильно различаются в зависимости от размера компании, отрасли и типа бизнеса, существует несколько ролей и обязанностей, которые должна содержать каждая стратегия восстановления:

  • Репортер инцидента: Лицо, которое отвечает за связь с заинтересованными сторонами и соответствующими органами власти в случае возникновения деструктивных событий и поддержание актуальности контактной информации для всех соответствующих сторон.
  • Менеджер плана аварийного восстановления: Ваш DRP-менеджер следит за тем, чтобы члены команды аварийного восстановления выполняли порученные им задачи и чтобы внедренная вами стратегия работала бесперебойно. 
  • Менеджер активов: Вам следует поручить кому-то роль по обеспечению безопасности и защите критически важных активов в случае стихийного бедствия и предоставлению отчетов об их статусе на протяжении всего инцидента.

Шаг 5. Тестируйте и уточняйте

Чтобы ваша стратегия аварийного восстановления была правильной, вам необходимо постоянно практиковать ее и регулярно обновлять в соответствии с любыми значимыми изменениями. Например, если ваша компания приобретает новые активы после формирования вашей стратегии DRP, их необходимо будет включить в ваш план, чтобы обеспечить их защиту в будущем. Тестирование и доработку вашей стратегии аварийного восстановления можно разбить на три простых этапа:

  1. Создайте точную симуляцию: При репетиции DRP постарайтесь создать среду, максимально приближенную к реальному сценарию, с которым столкнется ваша компания, не подвергая никого физическому риску.
  2. Определите проблемы: Используйте процесс тестирования DRP, чтобы выявить ошибки и несоответствия вашему плану, упростить процессы и устранить любые проблемы с процедурами резервного копирования.
  3. Проверьте свои процедуры аварийного восстановления: Очень важно увидеть, как вы будете реагировать на инцидент, но не менее важно протестировать установленные вами процедуры для восстановления критически важных систем после завершения инцидента. Проверьте, как вы снова включите сеть, восстановите все потерянные данные и возобновите нормальную бизнес-операцию. 

Решения для аварийного восстановления

Современные предприятия больше, чем когда-либо, полагаются на технологии при обслуживании своих клиентов. Даже незначительные сбои могут привести к критическим простоям и повлиять на доверие клиентов и инвесторов. Гарантия IBM FlashSystem Cyber ​​Recovery Guarantee предназначена для всех, кто приобретает новый массив FlashSystem Array с экспертной поддержкой IBM Storage и IBM Storage Insights Pro.

Исследуйте киберустойчивость с помощью IBM FlashSystem

Была ли эта статья полезна?

ДаНет


Еще от Облака




Варианты использования криптографии: от безопасной связи к безопасности данных 

6 мин чтенияКогда дело доходит до безопасности данных, древнее искусство криптографии стало краеугольным камнем современной цифровой эпохи. От сверхсекретной правительственной разведки до повседневных личных сообщений — криптография позволяет скрыть нашу самую конфиденциальную информацию от нежелательных наблюдателей. Совершая покупки в Интернете или сохраняя ценные коммерческие тайны на диск, мы можем быть благодарны криптографии за хоть какое-то подобие конфиденциальности, которое у нас может быть. Основные принципы криптографии устанавливают доверие при ведении бизнеса в Интернете. К ним относятся следующие: Конфиденциальность: зашифровано…




Ускорение устойчивой модернизации с помощью Green IT Analyser на AWS

11 мин чтенияПредприятия все чаще используют рабочие нагрузки с интенсивным использованием данных, включая высокопроизводительные вычисления, искусственный интеллект (ИИ) и машинное обучение (МО). Эти технологии стимулируют инновации в гибридных и мультиоблачных средах, уделяя особое внимание устойчивости, производительности, безопасности и соблюдению нормативных требований. Компании также стремятся сбалансировать эти инновации с растущими экологическими, социальными и управленческими нормами (ESG). Для большинства организаций ИТ-операции и модернизация являются частью их целей ESG, и, согласно недавнему опросу Foundry, около 60% организаций ищут поставщиков услуг, специализирующихся на экологических…




Представляем межрегиональную репликацию для IBM Cloud File Storage for VPC

4 мин чтенияВ постоянно развивающемся мире облачных вычислений компании все чаще полагаются на решения для облачного хранения файлов, чтобы обеспечить доступность, масштабируемость и безопасность данных. Одним из важнейших аспектов оптимизации вашей стратегии облачного хранилища является репликация, которая призвана помочь обеспечить непрерывность вашего бизнеса, аварийное восстановление, миграцию и расширение данных, обеспечивая плавную асинхронную репликацию для всех ваших общих файловых ресурсов, добавляя дополнительный уровень избыточности к вашим данным. . Понимание репликации Репликация — это процесс дублирования данных в нескольких местах хранения…




Как Jamworks защищает конфиденциальность, интегрируя преимущества искусственного интеллекта

6 мин чтенияИнтеграция искусственного интеллекта (ИИ) открыла новую эру технологического прогресса, предлагая целый ряд преимуществ во всех отраслях. Потенциал искусственного интеллекта произвести революцию в операциях, улучшить процесс принятия решений и стимулировать инновации неоспорим. Преимущества искусственного интеллекта многочисленны и впечатляющи: от прогнозной аналитики, которая уточняет стратегии, до обработки естественного языка, которая стимулирует взаимодействие с клиентами и помогает пользователям в их повседневных задачах, до вспомогательных инструментов, которые повышают доступность, общение и независимость для людей с ограниченными возможностями. «ИИ управляет…

Информационные бюллетени IBM

Получайте наши информационные бюллетени и обновления тем, в которых представлены последние передовые идеи и понимание новых тенденций.

Подписаться

Больше информационных бюллетеней

Отметка времени:

Больше от IBM