Статьи 19/12/2017

Виды резервного копирования: полный, инкрементальный и дифференциальный бэкап

Учитывая активное развитие зловредного ПО, опережающее развитие антивирусов, наиболее рационально строить ИТ-безопасность вокруг системы резервного сохранения информации. Вместо того, чтобы фокусироваться исключительно на предотвращении атак и борьбе с вирусами, гораздо проще, дешевле и легче поднять систему из резервных копий. Кроме того, бэкап поможет нивелировать последствия форс-мажорных обстоятельств или человеческого фактора, а также сбоя оборудования. В этой статье мы рассмотрим преимущества и недостатки самых распространенных видов резервного копирования.

Что такое полный бэкап (full backup)?

Полный бэкап

При полном бэкапе каждый раз создается полная копия всей системы, точнее, всех тех данных, которые вы определили для резервного копирования при постановке задачи. Для уменьшения итогового объема резервной копии все данные сжимаются в архив. Таким образом, в вашем хранилище при полном резервном копировании с заданной периодичностью появляются архивы, где данные в основной своей массе дублируются (поскольку на протяжении долгого времени не изменяются). Это серьезный недостаток, ведь расходуется огромный объем ресурсов: место в хранилище, время создания и процессорное время, вычислительные мощности, наконец, ресурсы трафика при транспортировке архивов в удаленную СХД.

Метод полного копирования ранее был очень распространенным из-за высокой надежности, однако в чистом виде на сегодняшний день он признан малоэффективным. Например, для резервного копирования невысокой глубиной (менее двух недель) или с высокой частотой (раз в сутки, раз в несколько часов) полный бэкап чрезмерно расходует ресурсы.

Немного спасет ситуацию механизм дедупликации – выявление и удаление дублирующихся данных в полных копиях. Он также задается специальными программными средствами как на уровне СХД или сервера, так и на клиенте непосредственно. Статистика в некоторых источниках приводит впечатляющие результаты степени дедупликации – от 90% до 98%.

Преимуществом полного бэкапа можно назвать разве что скорость восстановления: когда данные поднимаются из одного архива, это происходит быстрее, чем при инкрементальном или дифференцированном бэкапе. На сегодняшний день метод полного резервного копирования, как правило, используется исключительно как базовый в сочетании с другими методами, менее ресурсоемкими. Иногда такой подход называют еще смешанным или синтетическим бэкапом.

Что такое инкрементальный бэкап (incremental backup)?

Инкрементальный бэкап

Этот вид резервного копирования гораздо экономичнее и быстрее, чем полный бэкап, поскольку в этом процессе копируются только те файлы, которые изменились со времени предыдущего резервного копирования. Исходные данные, записанные изначально, не перезаписываются. Механизм инкрементального копирования прост: в качестве начальной точки бэкапа Х0 выбирается время (например, полночь с воскресенья на понедельник), в которое делается полный бэкап; в точке Х1 (полночь с понедельника на вторник) делается копирование файлов, измененных и/или появившихся с момента Х1; в точке Х2 (полночь со вторника на среду) копируются файлы, измененные/появившиеся с момента выполнения Х1; … в точке Хn происходит завершение цикла и делается следующий полный бэкап.

Этот метод гораздо более экономично расходует ресурсы и места в хранилище, и времени, и трафика передачи данных, по сравнению с другими. Однако при восстановлении данных в случае необходимости из резервной копии происходит поэтапное восстановление из точек Хn-1…Х2, Х1, Х0 – до последнего полного бэкапа включительно, и этот процесс может занять много времени в зависимости от объема данных.

Мы выбрали этот вид бэкапа для собственного сервиса резервного копирования в облаке – BaaS (Backup-as-a-Service). Чтобы решить проблему скорости восстановления, мы предлагаем клиентам опции BaaS Local и BaaS Remote – данные сохраняются либо в том же дата-центре, что и основная инфраструктура, или же на удаленной площадке. BaaS Local повышает скорость восстановления, а BaaS Remote повышает безопасность данных.

Что такое дифференциальный бэкап (differential backup)?

Дифференциальный бэкап

Дифференциальный бэкап выигрывает перед инкрементальным в случае скорости восстановления данных – время на эту операцию у него меньше, поскольку сравниваются полные копии Х0 и Хn и не требуется поэтапного восстановления. Однако в части объема пространства для размещения в СХД дифференциальное резервное копирование сопоставимо с полным, поэтому экономии места в хранилище и трафика практически не достигается.

При дифференциальном бэкапе происходит копирование «нарастающим итогом»: каждый измененный файл в каждой последующей точке бэкапа копируется заново. То есть выглядит это как: Х0, Х1, Х1+Х2, Х1+Х2+Х3, … +Хn, Х0+Х(1+…n)

Словом, очень громоздко и сложно при расчете места в СХД.

Понять разницу между инкрементальным и дифференциальным бэкапом достаточно просто. Фактически – она в одном слове. Просто сравните:

  • инкрементальный обрабатывает файлы, измененные или созданные с момента выполнения предыдущего бэкапа;
  • дифференциальный обрабатывает файлы, измененные или созданные с момента выполнения предыдущего полного бэкапа.

Какие еще виды резервного копирования существуют?

Разновидностью дифференциального бэкапа считается дельта-копирование (дельта-блочное или дельта-стилевое резервное копирование). При таком методе в копию записываются только изменения, происходящие в файлах, а не переписываются полностью изменяемые данные. То есть копируется частичка, а не весь файл. Правда, дельта-блочный метод можно применить именно на изменяемые, а не на создаваемые файлы – поэтому новые файлы копируются целиком.

Его отличает высокая скорость создания, крайняя экономия места и значительно меньшее (в сравнении с инкрементальным и дифференциальным бэкапами) количество избыточных данных. Казалось бы, применять дельту должны все, но этого не происходит, поскольку создание бэкапов таким способом и восстановление информации происходит средствами специального ПО. Кроме того, восстановление из дельта-бэкапа происходит очень долго: данные приходится собирать из мозаики измененных кусочков. Тем не менее, этим методом удобно пользоваться для обеспечения непрерывной защиты данных (когда бэкап файла делается непосредственно после его создания или внесения в него изменений) или в случаях пониженной пропускной способности при сохранении резервных копий в удаленном СХД.

Аналогично дельта-блочному бэкапу действует разработанный программистами метод бинарных патчей, при котором копируются частички измененных файлов, но применяется другая база сравнения (в дельте – блоки, в этом методе – биты информации). Однако необходимо иметь в виду, что оба упомянутых метода применяются в связке с дифференциальным или инкрементальным резервным копированием, но не сами по себе.

Иногда резервным копированием называют технологию зеркалирования, используемую, к примеру, на аппаратном уровне в RAID1 или при создании сайтов-зеркал. По сути же это – простое копирование исходных и измененных файлов, без архивирования и систематизации накопления изменяемых файлов в заданном периоде.

За последние 12-15 лет в технологиях резервного копирования произошло много критических изменений, заставивших пересмотреть эффективность подходов и открыть новые способы. Например, внедрение технологии снэпшотов (snapshots) – моментальных «снимков» файловой системы, из которых можно «склеить» резервную копию, – позволяют в облачных системах делать резервное копирование быстро и безболезненно, не останавливая виртуальной машины. Кроме того, применяясь в облаке, снэпшоты позволяют серьезно экономить ресурс СХД, поскольку на диске клиента они места не занимают.

Облачный Бэкап

Облачный бэкап

Ознакомьтесь с удобным облачным бэкап-решением SIM-Networks

Узнать больше

Как выбрать систему резервного копирования?

Если вы хотите самостоятельно заняться организацией резервного копирования данных, в поиске программы для бэкапов эксперты рекомендуют руководствоваться четырьмя универсальными критериями:

  • эффективность расхода ресурсов: программа должна работать в максимально автономном режиме (не отвлекая вас и не тратя ресурс вашего времени, то есть автоматизирована насколько возможно), с минимально возможной загрузкой ресурсов системы и выполняться за минимально возможное время;
  • скорость восстановления: ПО должно восстанавливать ваши данные из резервной копии максимально быстро, чтобы не страдали бизнес-процессы; идеальной будет функция работы напрямую с копиями данных;
  • защита данных и безопасность: программа для резервного копирования обязательно должна обеспечивать вам достаточный уровень безопасности – как криптографическими, так и аппаратными средствами (защита каналов передачи данных в СХД, защита данных во время операции резервного копирования, возможность восстановления прерванной сессии);
  • гибкость: ПО должно быть одинаково пригодно для всех типов данных (поскольку невозможно прогнозировать, какие из них вы посчитаете критически важными и выберете для копирования в резервное СХД), а также давать вам возможность выбора методов бэкапа и одинаково полноценно функционировать при любом из них.

Современное ПО, используемое профессиональными администраторами, всегда соответствует этим критериям. Кроме того, эксперты могут подобрать оптимальный вариант бэкапа для каждого конкретного случая. Это поможет избежать ситуаций, когда компания теряет все рабочие инструменты из-за некачественно настроенной системы резервного копирования. О том, как наши инженеры предотвратили подобные ситуации для клиента с опытом полного краха системы, вы можете узнать в кейсе миграции в облако и настройки резервного копирования.

Тэги:

#облако

Понравилась статья?

Согласие на использование файлов cookie

Нажимая «Я согласен», вы даете согласие на использование файлов cookie на нашем веб-сайте, чтобы предоставить вам наиболее релевантный опыт, запоминая ваши предпочтения и повторные посещения. Однако вы можете посетить «Управление файлами cookie», чтобы предоставить контролируемое согласие. Подробнее

Настройки файлов cookie

Функциональные

Необходимые файлы cookie имеют решающее значение для основных функций веб-сайта, и без них веб-сайт не будет работать должным образом.

Аналитические

Аналитические файлы cookie используются для понимания того, как посетители взаимодействуют с веб-сайтом.

Рекламные

Рекламные файлы cookie используются для предоставления посетителям релевантной рекламы и маркетинговых кампаний.