Восстановление после катастроф (в русскоязычных источниках также используется не вполне корректный термин аварийное восстановление) включает в себя набор политик, инструментов и процедур, позволяющих восстановить или продолжить работу жизненно важной технологической инфраструктуры и систем после стихийного бедствия или техногенной катастрофы[1]. Аварийное восстановление сосредоточено на информационных технологиях (ИТ) или технологических системах, поддерживающих критические бизнес-функции, в отличие от обеспечения непрерывности бизнеса, которое предполагает сохранение всех основных аспектов функционирования бизнеса, несмотря на значительные нарушения работы; поэтому его можно рассматривать как подмножество задач обеспечения непрерывности бизнеса[2][3]. Восстановление после катастроф предполагает, что основная часть первоначально работавшей информационной системы не подлежит восстановлению в течение некоторого времени, и представляет собой процесс восстановления данных и сервисов на второстепенных уцелевших площадках, противоположный процессу восстановления информационных систем на исходное место.
Планирование непрерывности ИТ-услуг (IT service continuity, ITSC)[4][5] — это подмножество планирования непрерывности бизнеса ( business continuity planning, BCP)[6], в котором основное внимание уделяется целевой точке восстановления (RPO) и целевому времени восстановления (RTO). Этот процесс включает в себя два вида планирования; Планирование аварийного восстановления ИТ и более широкое планирование устойчивости ИТ. Кроме того, он также включает в себя элементы управления ИТ-инфраструктурой и услугами, относящимися к связи, такими как (голосовая) телефония и передача данных.
Планирование включает организацию резервных площадок, независимо от того, являются ли они горячими, теплыми или холодными, а также опорных резервных площадок с оборудованием, необходимым для обеспечения непрерывности работы.
В 2008 году Британский институт стандартов опубликовал специальный стандарт, связанный и поддерживающий стандарт непрерывности бизнеса BS 25999, под названием BS25777, специально для согласования непрерывности работы IT-систем с непрерывностью бизнеса. Этот стандарт был отозван после публикации в марте 2011 г. стандарта ISO/IEC 27031 «Методы обеспечения безопасности. Руководство по обеспечению готовности информационных и коммуникационных технологий к обеспечению непрерывности бизнеса»[7].
ITIL также определяет некоторые из этих терминов[8].
Цель по времени восстановления
Цели по времени восстановления (Recovery Time Objective, RTO Этот термин также переводится как "Целевое время восстановления")[9][10] — это целевые продолжительность времени и уровень обслуживания, в рамках которых бизнес-процесс должен быть восстановлен после аварии (или сбоя), чтобы избежать неприемлемых последствий, связанных с перерывом в работе бизнеса[11].
В соответствии с методологией планирования обеспечения непрерывности бизнеса RTO устанавливается во время анализа воздействия на бизнес (Business Impact Analysis, BIA) владельцем (владельцами) процесса и включает определение временных рамок для альтернативных или ручных обходных путей восстановления.
В литературе по этому вопросу RTO упоминается как взаимодополняющий с целевой точкой восстановления (RPO). Вместо они описывают пределы приемлемой или «допустимой» производительности ITSC. RTO и RPO измеряют производительность ITSC с точки зрения времени, потерянного из-за нормального функционирования бизнес-процессов, и данных, потерянных или не зарезервированных в течение этого периода (RPO), соответственно[11][12].
Фактическое время восстановления
В обзоре Forbes отмечается[9], что фактическое время восстановления (Recovery Time Actual, RTA) на самом деле является критически важным показателем для обеспечения непрерывности бизнеса и аварийного восстановления.
Группа обеспечения непрерывности бизнеса проводит репетиции с таймингом фактически выполняемых действий, во время которых RTA определяется и корректируется при необходимости[9].
Целевая точка восстановления
Целевая точка восстановления (Recovery Point Objective, RPO) — это максимальный целевой период, в течение которого транзакционные данные теряются из IT-службой из-за крупного инцидента[11].
Например, в случае, если RPO измеряется в минутах (или даже в нескольких часах), то на практике необходимо постоянно поддерживать удаленные зеркальные резервные копии, поскольку ежедневного резервного копирования на ленте за пределами площадки недостаточно[13].
Отношение к цели по времени восстановления
Восстановление, которое не является мгновенным, позволит восстановить транзакционные данные в течение некоторого времени и сделать это без значительных рисков или потерь.
RPO измеряет максимальное время, в течение которого последние данные могли быть безвозвратно потеряны в случае серьезного инцидента, и не является прямым показателем количества таких потерь. Например, если BC планирует восстановить данные до последней доступной резервной копии, то RPO — это максимальный интервал между такими резервными копиями, которые были безопасно удалены из хранилища.
Часто неверно истолковывается, что RPO определяется существующим режимом резервного копирования, тогда как в действительности анализ влияния на бизнес определяет RPO для каждой службы. Когда требуются удаленные данные, период, в течение которого данные могут быть потеряны, часто начинается с момента подготовки резервных копий, а не с момента их переноса за пределы площадки[12].
Точки синхронизации данных
Точка синхронизации данных (она же - момент резервного копирования)[14] — это момент времени, когда выполняется резервное копирование физических данных. В наиболее простой реализации это момент, когда обработка очереди обновления данных в системе останавливается на время выполнения копирования с диска на диск. В современных системах обработка данных, как правило, продолжается параллельно с резервным копированием, которое осуществляется с использованием мгновенных снимков. Резервная копия[15] будет отражать более раннюю версию данных, а не то их состояние, которое возникло, когда данные копируются на резервный носитель или передаются в резервную локацию.
Как значения RTO и RPO влияют на дизайн компьютерной системы
RTO и RPO должны быть сбалансированы с учетом бизнес-рисков, а также всех других основных критериев проектирования системы.
RPO привязана ко времени выгрузки резервных копий за пределы площадки. Синхронное копирование данных на внешнее зеркало позволяет преодолеть большинство непредвиденных проблем с доступностью основной площадки. Физическое перемещение лент (или других переносных носителей) за её пределы обеспечивает часть потребностей в резервном копировании при относительно низких затратах. Восстановление из таких копий может быть осуществлено на заранее выбранной площадке[16].
Для больших объемов ценных транзакционных данных аппаратное обеспечение может быть разделено на две или более площадок путем разделения по географическим областям, что повышает отказоустойчивость.
Другие характеристики процесса восстановления
При более детальном планировании восстановления могут быть, также, использованы такие показатели как DOO – Degraded Operations Objective – допустимое замедление выполнения операций системой, происходящее в процессе перевода обработки данных на резервную площадку и NRO – Network Recovery Objective – минимальная полоса пропускания сети, которая подлежит восстановлению, чтобы обеспечить минимально приемлемые рабочие показатели восстанавливаемой системы[17].
История
Планирование аварийного восстановления и информационных технологий (ИТ) начало разрабатываться в середине-конце 1970-х годов, когда руководители компьютерных центров начали осознавать зависимость своих организаций от компьютерных систем.
В то время большинство систем представляли собой мейнфреймы, ориентированные на пакетную обработку. Другой удаленный мейнфрейм может быть загружен с резервных лент в ожидании восстановления основной площадки; время простоя было относительно менее критичным.
Индустрия аварийного восстановления появилась в качестве поставщика резервных компьютерных центров. Один из первых таких центров был расположен в Шри-Ланке (Sungard Availability Services, 1978)[18][19] developed to provide backup computer centers. One of the earliest such centers was located in Sri Lanka (Sungard Availability Services, 1978).[20][21].
В 1980-х и 90-х годах по мере роста внутрикорпоративного разделения времени, онлайн-ввода данных и обработки в режиме реального времени потребовалась большая доступность ИТ-систем.
Непрерывность ИТ-услуг важна для многих организаций при внедрении управления непрерывностью бизнеса (BCM) и управления информационной безопасностью (ICM), а также как часть внедрения и управления информационной безопасностью, а также управления непрерывностью бизнеса, как указано в ISO/IEC 27001 и ISO 22301 соответственно.
Рост облачных вычислений с 2010 года продолжает эту тенденцию: в настоящее время еще менее важно, где физически обслуживаются вычислительные службы, просто до тех пор, пока сама сеть достаточно надежна (отдельная проблема и не вызывает особого беспокойства, поскольку современные сети очень устойчивы). по дизайну). «Восстановление как услуга» (RaaS) — это одна из функций безопасности или преимуществ облачных вычислений, продвигаемых Cloud Security Alliance[22].
Классификация катастроф
Катастрофы могут быть классифицированы на три широких категории угроз и опасностей. К первой категории относятся стихийные бедствия, такие как наводнения, ураганы, торнадо, землетрясения и эпидемии.
Вторая категория – это технологические опасности, которые включают аварии или отказы систем и сооружений, такие как взрывы трубопроводов, транспортные аварии, сбои в работе коммунальных служб, прорывы плотин и случайные выбросы опасных материалов.
Третья категория — это антропогенные угрозы, которые включают преднамеренные действия, такие как активные атаки злоумышленников, химические или биологические атаки, кибератаки на данные или инфраструктуру и саботаж. Меры по обеспечению готовности ко всем категориям и типам стихийных бедствий относятся к пяти областям миссии: предотвращение, защита, смягчение последствий, реагирование и восстановление[23].
Важность планирования аварийного восстановления
Недавние исследования подтверждают идею о том, что внедрение более целостного подхода к планированию до стихийных бедствий является более рентабельным в долгосрочной перспективе. Каждый доллар, потраченный на смягчение опасностей (например, план аварийного восстановления), экономит обществу 4 доллара на реагировании и затратах на восстановление[24].
Статистика аварийного восстановления за 2015 год показывает, что простой в течение одного часа может стоить
Поскольку ИТ-системы становятся все более важными для бесперебойной работы компании и, возможно, экономики в целом, возрастает важность обеспечения непрерывной работы этих систем и их быстрого восстановления. Например, 43% компаний, в которых произошла крупная потеря бизнес-данных, никогда не открываются повторно, а 29% закрываются в течение двух лет. В результате к подготовке к продолжению или восстановлению систем необходимо относиться очень серьезно. Это требует значительных затрат времени и денег с целью обеспечения минимальных потерь в случае разрушительного события[26].
Меры борьбы
Меры борьбы — это действия или механизмы, которые могут уменьшить или устранить различные угрозы для организаций. В план аварийного восстановления (disaster recovery plan, DRP) могут быть включены различные типы мер.
Планирование аварийного восстановления является частью более крупного процесса, известного как планирование непрерывности бизнеса, и включает планирование возобновления работы приложений, данных, оборудования, электронных коммуникаций (например, сетей) и другой ИТ-инфраструктуры. План обеспечения непрерывности бизнеса (BCP) включает в себя планирование аспектов, не связанных с ИТ, таких как ключевой персонал, объекты, кризисная коммуникация и защита репутации, и должен ссылаться на план аварийного восстановления (DRP) для восстановления/непрерывности инфраструктуры, связанной с ИТ.
Меры по управлению аварийным восстановлением ИТ можно разделить на следующие три типа:
Превентивные меры – средства контроля, направленные на предотвращение возникновения события.
Меры обнаружения – средства контроля, направленные на обнаружение или обнаружение нежелательных событий.
Корректирующие меры – средства контроля, направленные на исправление или восстановление системы после аварии или события[27].
Хорошие меры плана аварийного восстановления требуют, чтобы эти три типа контроля были задокументированы и регулярно применялись с использованием так называемых «тестов аварийного восстановления».
Стратегии восстановления
Прежде чем выбрать стратегию аварийного восстановления, планировщик аварийного восстановления сначала обращается к плану обеспечения непрерывности бизнеса своей организации, в котором должны быть указаны ключевые показатели целевой точки восстановления и цели по времени восстановления[28] Затем показатели бизнес-процессов сопоставляются с их системами и инфраструктурой[29].
Отсутствие надлежащего планирования может увеличить последствия стихийного катастрофы[30]. После сопоставления метрик организация пересматривает ИТ-бюджет; показатели RTO и RPO должны соответствовать доступному бюджету. Анализ затрат и результатов часто определяет, какие меры аварийного восстановления следует применять.
New York Times пишет, что добавление облачного резервного копирования к преимуществам локального и удаленного архивирования на магнитных лентах «добавляет уровень защиты данных»[31].
Часто используемые стратегии защиты данных включают:
резервные копии, сделанные на ленту и отправленные за пределы офиса через регулярные промежутки времени
резервные копии, сделанные на диске на месте и автоматически скопированные на внешний диск или сделанные непосредственно на внешний диск
репликация данных в удаленное место, что избавляет от необходимости восстанавливать данные (затем необходимо восстанавливать или синхронизировать только системы), часто с использованием технологии сети хранения данных (SAN).
решения для частного облака, которые реплицируют конфигурационные и управляющие данные (виртуальные машины, шаблоны и диски) в домены хранения, являющиеся частью настройки частного облака. Эти данные настраивают в виде XML-представления, называемого OVF (формат открытой виртуализации), и конфигурация системы может быть восстановлена в случае аварии на их основе.
гибридные облачные решения, которые реплицируются как на месте, так и в удаленных центрах обработки данных. Эти решения обеспечивают возможность мгновенного переключения на локальное оборудование на месте, но в случае физической аварии серверы также могут быть переведены в облачные центры обработки данных.
использование систем высокой доступности, в которых данные и система реплицируются за пределами площадки, обеспечивая непрерывный доступ к системам и данным даже после аварии (часто связанной с облачным хранилищем)[32].
Во многих случаях организация может предпочесть использовать аутсорсингового поставщика аварийного восстановления для предоставления резервного сайта и систем, а не использовать свои собственные удаленные объекты, все чаще с помощью облачных вычислений.
В дополнение к подготовке к необходимости восстановления систем, организации также принимают меры предосторожности с целью превентивного предотвращения катастрофы. К ним могут относиться:
локальные зеркала систем и/или данных и использование технологий защиты дисков, таких как RAID
сетевые фильтры — для минимизации воздействия скачков напряжения на чувствительное электронное оборудование
использование источника бесперебойного питания (ИБП) и/или резервного генератора для поддержания работы систем в случае сбоя питания
системы предотвращения/смягчения пожара, такие как сигнализация и огнетушители
антивирусное программное обеспечение и другие меры безопасности
Классификация планов аварийного восстановления
Один из широко используемых видов классификации планов восстановления - семиуровневая классификация, разработанная в конце 1980-х годов комитетом SHARE Technical Steering
Committee, проводившим эту разработку совместно с компанией IBM. Они разработали технический документ, описывающий уровни обслуживания восстановления после катастроф с использованием уровней с 0 по 6. С тех пор появился целый ряд классификаций, конкурирующих с этой и отражающих дальнейшее развитие технологий и индустрии в целом. Разные классификации концентрируются на разных аспектах или технических особенностях процесса восстановления. Так, классификация Wiboobratr и Kosavisutee ориентирована, в основном, на решения DRaaS. Ниже приводится сравнительная таблица таких классификаций[33].
Осуществляется резервное копирование, резервные копии вывозятся в отдельное зданиеЮ но горячая резервная площадка отсутствует. Этот метод резервирования обозначают как «Pickup Truck Access Method (PTAM)[17].
Осуществляется резервное копирование на ленту за пределы рабочей площадки.
Возможно восстановление на момент времени.
Резервное копирование на ленту/ручное восстановление.
Уровень 4.
Резервные копии, осуществляемые по расписанию на "холодную" резервную площадку
2
Осуществляется резервное копирование, имеется горячая резервная площадка на которую могут быть восстановлены данные из резервной копии[17]. Метод известен как PTAM+hotsite.
Осуществляется резервное копирование на ленту на основную или резервную площадку.
Копии, сделанные на ленту доставляются на заранее подготовленную резервную площадку.
"Электронное хранилище" (electronic vaulting). По сравнению с уровнем 2 добавляется возможность регулярного копирования (и, соответственно, восстановления) данных с основной площадки. Типичное время восстановления - 24 часа[34].
"Электронное хранилище" - аналогично классификации SHARE/IBM.
Дисковые копии, обеспечивающие восстановление на момент времени осуществляются в несколько локаций
Гибкое (в том числе пофайловое и с выбором версии файла для восстановления) сохранение/восстановление образа диска.
Уровень 3.
Относительно быстрое восстановление из резервных копий, осуществляемых асинхронно или по расписанию на "тёплую" резервную площадку.
Аварийное восстановление как услуга (DRaaS) — это соглашение с третьей стороной, поставщиком услуг и/или оборудования.[41]. Обычно предлагается поставщиками услуг как часть их портфеля услуг. Ряд крупных поставщиков оборудования предлагают в качестве части такой услуги модульные датацентры, позволяющие максимально быстро развернуть необходимые для аварийного восстановления мощности оборудования.
↑Amendment #5 to S-1 (неопр.). SEC.gov. — «real-time ... provide redundancy and back-up to ...» Дата обращения: 4 мая 2022. Архивировано 10 марта 2013 года.
Sayyid al-MuʾaḏḏinBilāl bin RabāḥRepresentasi kaligrafi untuk nama Bilal bin Rabah.Nama asalبِلَال بِن رَبَاحLahir580 MMakkah, Hijaz, Jazirah ArabMeninggal2 Maret 640(640-03-02) (umur 59–60) MDamaskus, Kekhalifahan RasyidinPekerjaanMuazin dan Sekretaris Keuangan Negara Islam MadinahDikenal atasmuazin pertama dalam sejarah Islam.[1][2]Suami/istri Hind Halah binti Auf[3] Orang tuaRabah (bapak)Hamamah (ibu) Bilāl bin Rabāḥ (Arab: �...
Erica manipuliflora Klasifikasi ilmiah Kerajaan: Plantae Divisi: Tracheophyta Kelas: Magnoliopsida Ordo: Ericales Famili: Ericaceae Genus: Erica Spesies: Erica manipuliflora Nama binomial Erica manipulifloraSalisb. Erica manipuliflora adalah spesies tumbuhan yang tergolong ke dalam famili Ericaceae. Spesies ini juga merupakan bagian dari ordo Ericales. Spesies Erica manipuliflora sendiri merupakan bagian dari genus Erica.[1] Nama ilmiah dari spesies ini pertama kali diterbitkan oleh ...
Cet article est une ébauche concernant une localité italienne et la Lombardie. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Bigarello Administration Pays Italie Région Lombardie Province Mantoue Code postal 46030 Code ISTAT 020004 Code cadastral A866 Préfixe tel. 0376 Démographie Population 2 171 hab. (31-12-2010[1]) Densité 84 hab./km2 Géographie Coordonnées 45° 11′...
منتخب تونس تحت 18 سنة لكرة السلة 3x3 تونس منتخب تونس تحت 18 سنة لكرة السلة 3x3 التصنيف 33 ▲ 18 (16 سبتمبر 2019)[1] انضم للاتحاد الدولي 1956 منطفة فيبا الاتحاد الأفريقي لكرة السلة الاتحاد الوطني الجامعة التونسية لكرة السلة اللقب نسور قرطاج البلد تونس كأس العالم لكرة السلة المش�...
يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (نوفمبر 2019) الرابطة الجزائرية المحترفة الأولى 1998–99 تفاصيل الموسم الرابطة الجزائرية المحترفة الأولى البلد الجزا...
Gated community in Seal Beach, California Gated community of Seal Beach in California, United StatesSurfside, CaliforniaGated community of Seal BeachSurfside Colony, Ltd.Looking SE toward Huntington BeachSurfside, CaliforniaLocation in the United StatesCoordinates: = 33°43′44″N 118°5′2″W / 33.72889°N 118.08389°W / 33.72889; -118.08389CountryUnited StatesStateCaliforniaCountyOrangeCitySeal BeachArea • Total0.1 sq mi (1.6 km2)Elevat...
Bill WurtzLogo kanal Bill Wurtz per 2019Informasi pribadiPekerjaan Musisi YouTuber Situs webbillwurtz.comInformasi YouTubeKanal billwurtz PembuatBill WurtzTahun aktif2000 (mulai di YouTube pada 2013) – sekarangGenre Dokumenter komedi video musik pop indie jazz-pop lo-fi Pelanggan5,08 juta[1]Total tayang633 juta[1] Penghargaan Kreator 100.000 pelanggan 2016 1.000.000 pelanggan 2017 Diperbarui: 30 November 2021 Bill Wurtz (ditulis sebagai bill wurtz) adalah pembuat v...
Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Le ton de cet article est trop promotionnel ou publicitaire (novembre 2020). Vous êtes invité à améliorer l'article de manière à adopter un ton neutre (aide quant au style) ou discutez-en. Vous pouvez également préciser les sections non neutres en utilisant {{section promotionnelle}} et de souligner les passages problématiques avec {{passage promotionnel}}. Elie SaabBiographieNaissance 4 juillet 1964 (59...
Not to be confused with Arabish. This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Arablish – news · newspapers · books · scholar · JSTOR (October 2014) (Lea...
Village in Leinster, IrelandBallymore An Baile MórVillageR390 road through the villageBallymoreLocation in IrelandCoordinates: 53°29′28″N 7°40′48″W / 53.491°N 7.68°W / 53.491; -7.68CountryIrelandProvinceLeinsterCountyCounty WestmeathElevation128 m (420 ft)Population (2016)[1] • Total483Time zoneUTC+0 (WET) • Summer (DST)UTC-1 (IST (WEST))Irish Grid ReferenceN209490 Ballymore (Irish: An Baile Mór, meaning 'bi...
Boat lift This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Peterborough Lift Lock – news · newspapers · books · scholar · JSTOR (April 2022) (Learn how and when to remove this message) Peterborough Lift LockFront view of the Peterborough Lift Lock44°18′27″N 78°18′03″W / 44.30750°N 7...
This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: USCGC Mellon – news · newspapers · books · scholar · JSTOR (April 2009) (Learn how and when to remove this message) USCGC Mellon (WHEC-717) in the Bering Sea, 2001. History United States BuilderAvondale Shipyards Laid down25 July 1966 Launched11 February 1967 C...
Inscription on the Archbasilica of St. John Lateran in Rome: Indulgentia plenaria perpetua quotidiana toties quoties pro vivis et defunctis (English: Perpetual everyday plenary indulgence on every occasion for the living and the dead)Dòng chữ khắc trên tường của Tổng lãnh vương cung thánh đường Thánh Gioan Latêranô tại thành phố Roma: indulgentiaplenariaperpetuaquotidianatotiesquotiesprovivisetdefunctis(n.đ. 'Ơn toàn xá được ban cho đến đời đ�...
VoivodaRadomir PutnikGOLH, KCMG Kepala Staf Komando Tertinggi Angkatan Darat SerbiaMasa jabatan8 Oktober 1912 – 8 Desember 1915Penguasa monarkiPetar IPendahuluDirinya sendiriPenggantiPetar BojovićKepala Staf Umum SerbiaMasa jabatan19 September 1912 – 8 Oktober 1912Penguasa monarkiPetar IPendahuluDirinya sendiriPenggantiDirinya sendiriMasa jabatan1908 – 19 September 1912Penguasa monarkiPetar IPendahuluPetar BojovićPenggantiDirinya sendiriMasa jabatan1903...
Season of television series Season of television series FriendsSeason 2Friends season 2 DVD coverStarring Jennifer Aniston Courteney Cox Lisa Kudrow Matt LeBlanc Matthew Perry David Schwimmer No. of episodes24ReleaseOriginal networkNBCOriginal releaseSeptember 21, 1995 (1995-09-21) –May 16, 1996 (1996-05-16)Season chronology← PreviousSeason 1 Next →Season 3 List of episodes The second season of Friends, an American sitcom created by David Crane and Marta Kauffma...
Unincorporated community in Colorado, U.S. Quonset hut farm residence along County Road 80 in BuckeyeBarn in Buckeye Buckeye is a farming and ranching unincorporated community in north central Larimer County, Colorado, United States. Bounded on the west by the 16,500-acre (67 km2) Roberts Ranch, the area includes Red Mountain Open Space to the north, Rawhide flats to the east, and extends south to Owl Canyon.[1] The tallest structure in the area is a grain silo on County Road 78....