Связаться по Skype: vkarabedyants
Позвонить Написать
+7 (499) 404-28-83

Блог о системном администрировании серверов и сайтов

Установка, настройка программного обеспечения Linux, Windows операционных систем

Разработка стратегии резервного копирования

Чаще всего текущих ресурсов системы недостаточно для выполнения процедур резервирования. И, зачастую, приходится затратить достаточно много усилий на обоснование необходимости приобретения дополнительных аппаратных средств, для реализации процедуры резервирования. Ведь с точки зрения обычного пользователя подобная ситуация может быть маловероятной и малозначимой. Тем не менее, ее нельзя оставлять без внимания.

Таким образом, необходимо изначально определить перечень наиболее важных задач, которые должна будет осуществлять система для максимально эффективного хранения данных. С этой целью нужно ответить на ряд вопросов, благодаря которым можно будет определить ряд основных необходимых характеристик.

Первое что нужно определить – насколько важны сохраняемые данные. В случае если данные можно восстановить, заново загрузив или пересоздав, то операции по резервному копированию можно проводить реже. В случае если данные очень важны, необходимо применять более надежную стратегию резервного копирования.

Следующим немаловажным фактором является частота внесения изменений в данные. Чем чаще меняются данные, тем чаще необходимо выполнять операцию резервирования.

В этом случае необходимо рассчитывать необходимое количество дискового пространства. Ведь на объемы влияет количество копий, которые необходимо одновременно хранить в системе.

В случае развернутой неоднородной  информационной инфраструктуры предприятия может возникнуть необходимость разделить информацию по типам с различными требованиями к резервированию.

Всего существует несколько видов резервного копирования. Это полное резервное копирование, дифференциальное резервное копирование, инкрементное резервное копирование.

Полное резервное копирование является главным и основополагающим методом создания резервных копий, при котором выбранный массив данных копируется целиком. Это наиболее полный и надежный вид резервного копирования, хотя и самый затратный. В случае необходимости сохранить несколько копий данных общий хранимый объем будет увеличиваться пропорционально их количеству. Для предотвращения большого объёма использованных ресурсов используют алгоритмы сжатия, а также сочетание этого метода с другими видами резервного копирования: инкрементным или дифференциальным. И, конечно, полное резервное копирование незаменимо в случае, когда нужно подготовить резервную копию для быстрого восстановления системы с нуля.

Данный метод имеет как свои достоинства, так и недостатки. Основными достоинством является простота восстановления с нуля. Так как массив сохранен полностью, также не составляет труда восстановить лишь часть необходимых данных. Из недостатков можно выделить избыточность данного метода. В процессе работы многие файлы могут остаться неизмененными, тем не менее, они также будут включены в резервную копию. Таким образом, потребуется достаточно большой объем носителя. Полное резервное копирование занимает не только излишнее пространство на хранилище, оно также может потребовать больших затрат по времени, в особенности при наличии сетевого хранилища.

Инкрементное резервное копирование, в отличии от полного резервного копирования, копирует не все данные, а только те, что были изменены с момента последнего копирования. Для выяснения времени копирования могут применяться различные методы, например, в системах под управлением операционных систем семейства Windows используется соответствующий атрибут файла (архивный бит), который устанавливается, когда файл был изменен, и сбрасывается программой резервного копирования. В других системах может использоваться дата изменения файла. Понятно, что схема с применением данного вида резервного копирования будет неполноценной, если время от времени не проводить полное резервное копирование. При полном восстановлении системы нужно провести восстановление из последней копии, а потом поочередно восстановить данные из инкрементных копий в порядке их создания. Данный вид используется для того, чтобы в случае создания архивных копий сократить расходуемые объемы на устройствах хранения информации. Также это позволит минимизировать время выполнения заданий резервного копирования, что может быть крайне важно в условиях, когда платформа работает постоянно. У инкрементного копирования есть один нюанс: поэтапное восстановление возвращает и ненужные удаленные файлы за период восстановления. Поэтому при последовательном восстановлении данных из архива имеет смысл резервировать больше дискового пространства, чтобы смогли поместиться в том числе и удаленные файлы.

Из достоинств метода можно выделить эффективное использование носителей. Поскольку сохраняются только файлы, измененные с момента последнего полного или инкрементального резервного копирования, резервные копии занимают меньше места. Соответственно меньшее время резервного копирования и восстановления. Инкрементальное резервное копирование занимает меньше времени, чем полное и дифференциальное резервное копирование.

Недостаток метода заключается в том, что данные резервного копирования сохраняются на нескольких носителях. Поскольку резервные копии расположены на нескольких носителях, восстановление устройства после аварии может занять больше времени. Кроме того, для эффективного восстановления работоспособности системы носители должны обрабатываться в правильном порядке.

Дифференциальное резервное копирование отличается от инкрементного тем, что копируются данные с последнего момента выполнения полного копирования. Данные при этом помещаются в архив «нарастающим итогом». В системах семейства Windows этот эффект достигается тем, что архивный бит при дифференциальном копировании не сбрасывается, поэтому измененные данные попадают в архивную копию, пока полное копирование не обнулит архивные биты. В силу того, что каждая новая копия, созданная таким образом, содержит данные из предыдущей, это более удобно для полного восстановления данных на момент аварии. Для этого нужны только две копии: полная и последняя из дифференциальных, поэтому вернуть утерянные данные можно гораздо быстрее, чем поэтапно восстанавливать все инкременты. К тому же, этот вид копирования избавлен от вышеперечисленных особенностей инкрементного, когда при полном восстановлении старые файлы восстанавливаются без необходимости. При данном методе возникает меньше несоответствий. Но дифференциальное копирование значительно проигрывает инкрементному в экономии требуемого пространства. Так как в каждой новой копии хранятся данные из предыдущих, суммарный объем зарезервированных данных может быть сопоставим с полным копированием. Недостатком метода, как при создании полной архивной копии, является избыточная защита данных. Сохраняются все файлы, измененные с момента последнего инкрементального резервного копирования.

В процессе выполнения резервного копирования данных появляется проблема выбора технологии хранения резервных копий и данных. В настоящее время наибольшее распространение получили следующие виды носителей: накопители на магнитных лентах; сетевые технологии; дисковые накопители.

Наиболее часто встречающийся вид дисковых накопителей: накопители на жёстких магнитных дисках.

Накопители на жестких магнитных дисках являются основными устройствами оперативного хранения информации. Относительно корпуса сервера различают внутренние и внешние накопители. Внутренние накопители существенно дешевле, но их максимальное количество ограничивается числом свободных отсеков корпуса, мощностью и количеством соответствующих разъемов блока питания сервера Внутренние накопители с возможностью «горячей» замены (HotSwap) представляют собой обычные винчестеры, установленные в специальные кассеты с разъемами. Кассеты обычно вставляются в специальные отсеки со стороны лицевой панели корпуса, конструкция позволяет вынимать и вставлять дисководы при включенном питании сервера. Внешние накопители имеют собственные корпуса и блоки питания, их максимальное количество определяется возможностями интерфейса. Обслуживание внешних накопителей может производиться и при работающем сервере, хотя может требовать прекращения доступа к части дисков сервера.

Для больших объемов хранимых данных применяются блоки внешних накопителей – дисковые массивы и стойки, представляющие собой сложные устройства с собственными интеллектуальными контроллерами, обеспечивающими, кроме обычных режимов работы, диагностику и тестирование своих накопителей. Более сложными и надежными устройствами хранения являются RAID-массивы (Redundant Array of Inexpensive Disks – избыточный массив недорогих дисков). Для пользователя RAID представляет собой один диск, в котором производится одновременная распределенная избыточная запись (считывание) данных на несколько физических накопителей (типично 4–5) по правилам, определяемым уровнем реализации (0–10).

Достоинствами таких накопителей является быстрый доступ к данным и возможность параллельного доступа к данным без значительной потери скорости. Из недостатков можно выделить достаточно высокую стоимость, более высокое энергопотребление, более дорогое расширение системы хранения данных, невозможность обеспечения высокой безопасности копий.

Существует также возможность хранения резервируемых данных на сетевом хранилище. По большому счету, информация будет храниться на тех же самых дисковых накопителях, только в удаленной хранилище. Единственное отличие – связь с ним будет осуществляться посредством сетевых технологий. Основным преимуществом является простота в подключении дополнительных платформ для хранения данных и необязательность их размещения в непосредственной близости от серверов, на которых размещены данные подлежащие копированию. Дополнительно, в самом сетевом хранилище возможно установить любой уровень Raid массива, тем самым обеспечив гибкость в выборе уровня безопасности для хранимых данных. В некоторых случаях можно даже не докупать оборудование, а разместить информацию на арендованных площадках. Цена при этом будет значительно ниже, чем при закупке оборудования для хранения массивов данных. Единственным неудобством при подобном размещении данных является низкая, в некоторых случаях, скорость доступа. И необходимость резервирования также линии связи для доступа к хранилищу.

Одним из самых дешевых (если рассчитать стоимость накопителя в расчете на 1 Гб данных) методов хранения информации является использование ленточных накопителей. Роботизированные ленточные библиотеки за последние годы проделали значительный эволюционный путь. Как и модульные дисковые массивы, такие библиотеки обеспечивают гибкое и, главное, экономичное наращивание емкости системы по мере роста объемов данных, которые необходимо сохранять на ленте, высокую надежность работы, а также обладают мощными средствами удаленного управления и мониторинга. Даже самые большие библиотеки имеют ограничения по числу слотов для ленточных картриджей, однако если все картриджи в библиотеке будут заполнены, то часть из них, на которых записаны старые резервные копии, можно отправить в хранилище, а на их место установить чистые картриджи. Для дисковых массивов такой вариант «неограниченного» масштабирования невозможен хотя бы потому, что жесткие диски стоят намного дороже картриджей и не предназначены для длительного хранения в отключенном состоянии. Основным недостатком подобных систем хранения можно считать наличие механической части для обращения к необходимому картриджу с лентой. Второй, достаточно ощутимый, но не критический минус – скорость копирования на ленту. Она значительно ниже, чем в дисковых массивах. Но из данной ситуации был быстро найден выход. Библиотеки оснащаются дисковыми массивами и первоначально необходимые данные списываются на него, а уже после – переносятся на магнитную ленту, никоим образом не мешая работе системы.

Как и было сказано выше, одного резервного копирования недостаточно. Необходим комплекс мер по предотвращению аварийных ситуаций. Все компоненты инфраструктуры резервного копирования должны учитываться в процессе планирования, а все приложения, серверы и тенденции увеличения емкости первичных хранилищ данных не должны оставаться без внимания.

Обзор логов ошибок и выполнения резервного копирования является необходимой ежедневной задачей. Проблемы при резервном копировании, как правило, возникают лавинообразно. Один-единственный сбой может повлечь за собой целую последовательность, на первый взгляд даже не связанных между собой затруднений. Например, задание резервного копирования может либо «зависнуть», либо не запуститься из-за того, что нужный привод магнитных лент не был освобожден предыдущим заданием. Подобные ситуации требуют немедленного вмешательства и корректировки процесса резервирования, дабы избежать в будущем проблем с отсутствием необходимых копий.

Все приложения резервного копирования ведут свою базу данных или каталог, необходимые для последующего восстановления сохраненных данных. Потеря каталога влечет потерю сохраненных данных. Хотя некоторые приложения резервного копирования имеют механизмы корректного чтения лент и индексов для восстановления, это может оказаться непосильной задачей. Такой каталог должен рассматриваться как любое другое критически важное приложение баз данных. Желательно иметь его зеркальную копию или, по крайней мере, хранить в RAID-системе. Кроме того, желательно убедиться в том, что каталог сохраняется согласно расписанию и без ошибок. Повреждение базы также может быть причиной нежелательной потери данных.

Также, в реальных системах данные необходимо дифференцировать. Ответственный за резервное копирование должен четко понимать принцип работы системы и различать данные по типам. Как была указано выше, некоторые данные можно резервировать реже, некоторые необходимо чаще. Составление расписания и частоты копирования является одной из наиболее ответственных задач. Но, даже с учетом различности данных, система должна быть максимально автоматизированная и централизована.

Еще одной немаловажной процедурой является проверка созданных копий на считывание. Действительно, иногда резервные копии, по той или иной причине, могут не читаться. И этот факт желательно обнаружить не в тот момент, когда понадобится копия для восстановления.

Таким образом, четко разработанная и спланированная стратегия резервного планирования сможет полностью исключить и предупредить возникновение внештатных ситуаций и потерю данных, тем самым обеспечив полноценное и бесперебойное функционирование информационной инфраструктуры предприятия.

1 Response

  1. Tutanhamon

    Полезная статья. Вообще, видов резервного копирования достаточно много. И к ним относятся не только инкрементальные и дифференциальные. Например, в статье по адресу http://ida-freewares.ru/terminologiya-rezervnogo-kopirovaniya-chto-oznachaet-inkrementalnyj-i-differentsialnyj-i-zachem-oni-nuzhny.html приводится еще ряд интересных видов. К примеру, резервное копирование на основе жестких ссылок, поддерживаемых в системе, позволяет достаточно неплохо сэкономить на свободном месте диска, хотя и имеет ряд особенностей, как необходимость аккуратно следить за изменениями данных в местах, где хранятся бэкапы.

Оставить комментарий

Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.