[ Страница назад | Страница вперед | Содержание | Индекс | Библиотека | Юридическая информация | Поиск ]

Руководство по настройке производительности


Работа с массивами RAID

Резервный массив независимых дисков (RAID) представляет собой способ повышения коэффициента доступности данных путем применения массивов дисков и различных алгоритмов распределения данных по дискам. Дисковый массив - это группа дисковых устройств, совместное применение которых позволяет обеспечить более высокую производительность операций ввода-вывода и скорость передачи данных, чем при использовании одиночных устройств большого объема. Массив представляет собой набор дисков, управляемых специальным контроллером (контроллером массива), который обеспечивает правильное распределение данных по отдельным дискам. Данные каждого файла записываются не на один диск, а разбиваются на сегменты и распределяются по нескольким дискам массива.

Кроме того, массивы обеспечивают резервирование данных, обеспечивая их сохранение даже в случае сбоя одного из дисков. В зависимости от уровня RAID, данные могут сохраняться на дисках с зеркальным копированием или с чередованием данных.

Подмассивы входят в состав подсистемы массива. В зависимости от настройки, подсистема массива может содержать один или несколько подмассивов, называемых также логическими устройствами (LUN). Каждый LUN характеризуется собственным набором параметров (уровень RAID, размер логического блока и логического устройства и т.п.). С точки зрения операционной системы каждый подмассив представляет собой отдельный диск с собственным именем.

Алгоритмы поддержки RAID могут быть реализованы в составе средств поддержки файловой системы в операционной системе или в составе драйвера диска (последний подход применяется в RAID 0 и RAID 1). Выполнять такие алгоритмы может встроенный микропроцессор аппаратного адаптера RAID. Аппаратные адаптеры RAID как правило обеспечивают более высокую скорость работы, чем программные средства поддержки RAID, поскольку встроенный процессор уменьшает нагрузку на центральный процессор. Кроме того, в аппаратных адаптерах могут быть реализованы аппаратные схемы передачи и обработки данных.

Уровни RAID и их производительность

На каждом из уровней RAID, поддерживаемых дисковыми массивами, применяется свой способ записи данных, и, следовательно, каждый из уровней имеет собственные преимущества.

RAID 0 - Производительность

RAID уровня 0 также называется RAID с чередованием данных. Этот уровень удобен для программ, требующих быстрой загрузки больших таблиц, или, в общем случае, для приложений, требующих быстрого доступа к данным только для чтения или для быстрой записи. RAID 0 разработан исключительно для повышения производительности и не обеспечивает резервирования данных, поэтому в случае сбоя диска требуется восстановление информации из резервной копии. Уровень RAID 0 следует выбирать при использовании приложений, чувствительных к повышению быстродействия дисковой подсистемы. Никогда не используйте этот уровень при работе с приложениями, требующими высокой надежности.

RAID 1 - Надежность и быстрое выполнение операций чтения

RAID уровня 1 также называется RAID с зеркальной защитой дисков. Этот уровень разработан для приложений, требующих высокого коэффициент доступности данных и небольшого времени отклика при чтении, когда стоимость оборудования рассматривается как вторичный фактор. Время отклика при записи может быть несколько больше, чем при использовании отдельного диска, в зависимости от стратегии записи; запись может выполняться параллельно (для ускорения операции) или последовательно (для повышения надежности). RAID 1 следует применять при работе с приложениями, которые часто считывают, но редко записывают данные, если стоимость не играет первостепенной роли.

RAID 2 - Редко применяется

RAID 2 применяется редко. Этот уровень использует ту же технологию, что и RAID 3, но может хранить данные контроля четности на нескольких дисках, в то время как в RAID 3 эти данные хранятся только на одном диске.

RAID 3 - CAD/CAM, последовательный доступ к большим файлам

В RAID 3 и RAID 2 реализован механизм параллельной обработки, когда все диски массива работают одновременно. Аналогично технологии чередования данных, записываемая на диск информация разбивается на сегменты фиксированного размера, после чего эти сегменты параллельно записываются в одну и ту же физическую область разных дисков. В наиболее современных массивах RAID 2 и 3 вращение дисков синхронизировано, поэтому операции записи и чтения действительно выполняются одновременно, позволяя тем самым избежать дополнительных задержек. Такой подход требует сохранения информации о четности для каждого сегмента данных; разница между RAID 2 и RAID 3 заключается в том, что RAID 2 может хранить эту информацию на нескольких дисках, в то время как в RAID 3 для этой цели используется только один диск. LVM не поддерживает RAID 3, поэтому этот массив дисков можно использовать только как устройство с линейным доступом.

При работе с большими объемами данных производительность такого массива достаточно велика, однако небольшие запросы обрабатываются сравнительно медленно, поскольку все диски используются одновременно и выполнение параллельных операций невозможно. Такие массивы оптимальны при работе с большими объектами, например с файлами систем CAD/CAM или с изображениями, а также при работе с приложениями, требующими последовательного доступа к большим файлам данных. Уровень RAID 3 следует использовать при работе с большими блоками данных. RAID 3 обеспечивает хранение избыточных данных, не требуя таких затрат ресурсов, как уровень RAID 1.

RAID 4 - Применяется редко (том для хранения контрольных данных является узким местом)

RAID 4 использует блоки данных большего размера, чем в RAID 3 и распределяет данные по всем дискам, кроме одного, предназначенного только для хранения информации о четности. Обработка запросов на запись требует выполнения полного цикла чтение-изменение-обновление, причем узким местом в этом случае является диск с информацией о четности. Таким образом, уровень RAID 4 применяется реже, чем RAID 5, который обеспечивает те же функции, но поддерживает хранение контрольной информации на нескольких дисках.

RAID 5 - Высокий коэффициент доступности данных; запись выполняется реже, чем чтение

RAID 5, как уже было сказано, очень похож на RAID 4. Разница заключается в том, что информация о четности распределена по тем же дискам, что и сами данные. Информация о четности никогда не хранится на том же диске, что и сегмент данных, к которому относится эта информация. Это значит, что можно выполнять одновременные операции чтения и записи, причем благодаря наличию еще одного диска (применявшегося в RAID 4 для хранения информации о четности) достигается дополнительный выигрыш в производительности. Существуют и другие способы повышения скорости передачи данных, например, кэширование одновременно считанных блоков информации и передача этих блоков во время чтения следующей порции информации. Таким образом, данные можно передавать с максимальной скоростью, поддерживаемой адаптером.

RAID 5 оптимален для приложений, требующих высокого коэффициента готовности и выполняющих больше операций чтения, чем записи. Уровень RAID 5 следует выбирать при работе с приложениями, использующими небольшие блоки данных, например, приложениями для обработки транзакций.

RAID 6 - Редко используется

Уровень RAID 6 аналогичен RAID 5, но благодаря сохранению дополнительной информации о четности позволяет восстанавливать данные даже в случае сбоя двух дисков. В этом случае для хранения контрольной информации требуются дополнительные диски, а скорость записи ниже, чем в аналогичных массивах RAID 5.

RAID 7 - Определение независимых производителей

В архитектуре RAID 7 данным и информации о четности присвоен одинаковый приоритет. Реализация уровня RAID 7 позволяет добиться максимальной скорости обращения к данным, хранящимся на каждом из дисков. Для этого применяются следующие средства:

RAID 10 - RAID-0+1

Уровень RAID-0+1, называемый также RAID 10, реализует технологию чередования данных и создания зеркальных копий. Несмотря на устоявшееся название, RAID 10 формально не соответствует спецификации RAID Advisory Board (RAB). В RAID 10 данные распределяются по нескольким дискам, а затем эти диски зеркально копируются на другой набор дисков.

Производительность массивов RAID 10 при выполнении операций последовательного ввода-вывода аналогична производительности массивов RAID 0. RAID 10 обеспечивает улучшенные функции зеркального копирования с чередованием данных и их распределением между разными дисками массива. Первый сегмент данных представляет собой собственно данные; второй сегмент - зеркальную копию первого, но сдвинутую на один диск, и т.д. Из-за хранения зеркальных копий объем логического устройства составляет половину объема физических дисков, входящих в состав массива.

Обзор уровней RAID

В следующей таблице перечислены достоинства и недостатки разных уровней RAID:

Уровень RAID Надежность Объем Производительность Стоимость
0 нет 100 % высокая средняя
1 зеркальные копии 50 % средняя/высокая высокая
2/3 контроль четности 80 % средняя средняя
4/5/6/7 контроль четности 80 % средняя средняя
10 зеркальные копии 50 % высокая высокая

Обзор производительности различных уровней RAID

Наиболее часто встречаются массивы RAID следующих уровней: 0, 1, 3 и 5. Уровни 2, 4 и 6 не имеют функциональных преимуществ перед другими уровнями, и их производительность в отдельных ситуациях ограничена. Как правило, вместо RAID 3 используется RAID 5, что позволяет избежать недостатков, связанных с хранением контрольной информации на одном диске.

Уровни RAID 0 и RAID 1 могут быть реализованы одними только программными средствами. Для работы с RAID 3, 5 и 7 необходимы специальные программы и устройства (специальные контроллеры и адаптеры RAID).

Более подробная информация приведена в разделе Настройка и реализация сервера IBM Fibre Channel RAID Storage Server.


[ Страница назад | Страница вперед | Содержание | Индекс | Библиотека | Юридическая информация | Поиск ]