Що таке RAID: рівні RAID, принцип роботи та навіщо він потрібен
Вступ
У сучасній ІТ-інфраструктурі дані є одним із найцінніших ресурсів. Сервери, системи віртуалізації, бази даних, файлові сховища та резервні копії постійно працюють із великими обсягами інформації. Втрата даних через збій накопичувача може призвести до простою сервісів, фінансових втрат або навіть повної недоступності критичних систем.
Саме тому в корпоративному середовищі широко використовується RAID - технологія об’єднання кількох фізичних накопичувачів у єдиний логічний масив для підвищення відмовостійкості, продуктивності або обох параметрів одночасно.
RAID застосовується як у невеликих NAS-сховищах, так і в enterprise-рішеннях: дата-центрах, SAN-системах, гіперконвергентних платформах, кластерах баз даних та системах резервного копіювання.
У цій статті розглянемо:
- що таке RAID;
- як працюють RAID-масиви;
- які існують рівні RAID;
- формули розрахунку корисного об’єму;
- переваги та недоліки різних конфігурацій;
- практичні сценарії використання.
Що таке RAID
RAID (Redundant Array of Independent Disks) - це технологія об’єднання декількох фізичних дисків у логічний масив для:
- підвищення продуктивності;
- забезпечення відмовостійкості;
- збільшення доступного об’єму;
- мінімізації ризику втрати даних.
Основна ідея RAID полягає в тому, що дані розподіляються між кількома накопичувачами за певним алгоритмом.
RAID може працювати:
- на апаратному рівні - через RAID-контролер;
- на програмному рівні - засобами операційної системи.
Найчастіше RAID використовується з:
- HDD;
- SATA SSD;
- SAS SSD;
- NVMe SSD.
Основні принципи роботи RAID
RAID базується на трьох ключових механізмах:
Striping - розподіл даних
Дані розбиваються на блоки та записуються паралельно на кілька дисків.
Переваги:
- висока швидкість читання;
- висока швидкість запису.
Недолік:
- відсутність відмовостійкості.
Mirroring - дзеркалювання
Ідентична копія даних записується на інший диск.
Переваги:
- висока надійність;
- швидке відновлення після збою.
Недоліки:
- втрата 50% доступного об’єму.
Parity - контроль парності
RAID зберігає додаткову інформацію для відновлення даних у разі виходу диска з ладу.
Переваги:
- баланс між ємністю та надійністю.
Недоліки:
- складніші обчислення;
- нижча продуктивність запису.
RAID 0 - максимальна продуктивність
Принцип роботи
RAID 0 використовує striping без резервування.
Дані розподіляються між усіма дисками масиву.
Переваги
- максимальна швидкість;
- ефективне використання дискового простору;
- простота реалізації.
Недоліки
- повна відсутність відмовостійкості;
- збій одного диска призводить до втрати всіх даних.
Де використовується
- тимчасові кеші;
- scratch storage;
- відеомонтаж;
- високопродуктивні обчислення.
RAID 1 - дзеркалювання
Принцип роботи
RAID 1 дублює дані на кілька накопичувачів.
Кожен запис копіюється на всі диски масиву.
Переваги
- висока надійність;
- швидке відновлення;
- просте адміністрування.
Недоліки
- використовується лише 50% об’єму;
- вища вартість зберігання.
Типові сценарії
- системні диски серверів;
- бази даних;
- критичні сервіси.
RAID 5 - баланс продуктивності та надійності
Принцип роботи
RAID 5 використовує striping із розподіленою парністю.
Паритетна інформація розміщується на всіх дисках масиву.
Відмовостійкість
RAID 5 витримує вихід з ладу одного диска.
Переваги
- хороше співвідношення ємності та надійності;
- ефективне використання простору;
- висока швидкість читання.
Недоліки
- повільніший запис;
- довге відновлення;
- ризик втрати даних під час rebuild на великих HDD.
Практичний кейс
Файловий сервер компанії:
- 6 HDD по 8 ТБ;
- RAID 5;
- доступний об’єм:
V=(6−1)×8TB=40TBV=(6-1) \times 8TB = 40TBV=(6−1)×8TB=40TB
RAID 6 - підвищена відмовостійкість
Принцип роботи
RAID 6 схожий на RAID 5, але використовує подвійний паритет.
Відмовостійкість
RAID 6 дозволяє втратити два диски без втрати даних.
Переваги
- висока надійність;
- безпечніший rebuild;
- хороший вибір для великих масивів.
Недоліки
- нижча швидкість запису;
- складніші обчислення паритету.
Де використовується
- enterprise storage;
- системи резервного копіювання;
- архівні сховища.
RAID 10 - продуктивність та відмовостійкість
Принцип роботи
RAID 10 (1+0) поєднує:
- RAID 1;
- RAID 0.
Спочатку створюються дзеркальні пари, після чого між ними виконується striping.
Переваги
- дуже висока продуктивність;
- швидкий rebuild;
- висока відмовостійкість.
Недоліки
- 50% втрати об’єму;
- висока вартість.
Практичний кейс
RAID 10 часто використовується для:
- PostgreSQL;
- MySQL;
- VMware;
- Hyper-V;
- високонавантажених OLTP-систем.
Порівняння рівнів RAID
| RAID | Мін. дисків | Відмовостійкість | Формула | Продуктивність | Ефективність об’єму |
|---|---|---|---|---|---|
| RAID 0 | 2 | Немає | V = N * S | Дуже висока | 100% |
| RAID 1 | 2 | 1 диск | V = (N * S) / 2 | Висока | 50% |
| RAID 5 | 3 | 1 диск | V = (N - 1) / S | Висока | ~75–90% |
| RAID 6 | 4 | 2 диск | V = (N - 2) / S | Середня | ~65–85% |
| RAID 10 | 4 | Залежить від пари | V = (N * S) / 2 | Дуже висока | 50% |
Де:
-
— кількість дисків;N -
— об’єм найменшого диска.S
Апаратний та програмний RAID
Апаратний RAID
Реалізується через RAID-контролер.
Переваги
- незалежність від ОС;
- висока продуктивність;
- кешування;
- battery-backed cache.
Недоліки
- висока вартість;
- залежність від моделі контролера.
Популярні виробники
- Broadcom
- Dell Technologies
- Hewlett Packard Enterprise
Програмний RAID
Реалізується засобами ОС.
Linux
Найпоширеніший інструмент:
- mdadm.
Приклад створення RAID 1 у Linux
sudo mdadm --create --verbose /dev/md0 \--level=1 \--raid-devices=2 \/dev/sdb /dev/sdc
Перевірка стану масиву
cat /proc/mdstat
Переваги
- безкоштовно;
- гнучкість;
- просте масштабування.
Недоліки
- навантаження на CPU;
- залежність від ОС.
Що таке rebuild RAID
Rebuild - це процес відновлення RAID після заміни несправного диска.
Під час rebuild:
- контролер або ОС відновлює дані;
- використовується паритет або дзеркало;
- продуктивність системи знижується.
Чому rebuild небезпечний
На великих HDD rebuild може тривати:
- десятки годин;
- інколи - кілька діб.
У цей час:
- масив працює у деградованому режимі;
- зростає ризик другого збою.
Саме тому RAID 5 поступово втрачає популярність у великих сховищах.
RAID не є резервним копіюванням
Одна з найпоширеніших помилок - вважати RAID бекапом.
RAID захищає лише від:
- виходу диска з ладу.
RAID не захищає від:
- видалення файлів;
- ransomware;
- пошкодження файлової системи;
- помилок адміністратора;
- пожежі;
- компрометації сервера.
Для захисту даних необхідно використовувати:
- резервне копіювання;
- snapshots;
- offsite backup;
- immutable backup.
Практичні рекомендації щодо вибору RAID
Для домашнього NAS
Рекомендовано:
- RAID 1;
- RAID 5.
Для віртуалізації
Оптимально:
- RAID 10;
- SSD або NVMe.
Для великих архівів
Доцільно:
- RAID 6.
Для баз даних
Найкращий вибір:
- RAID 10.
Типові помилки при роботі з RAID
Використання різних дисків
RAID працює за найменшим диском.
Наприклад:
- 2 ТБ;
- 4 ТБ;
- 8 ТБ.
Масив використовуватиме лише 2 ТБ кожного диска.
Відсутність моніторингу
Необхідно контролювати:
- SMART;
- latency;
- bad sectors;
- температуру.
Ігнорування hot spare
Hot spare - резервний диск, який автоматично використовується при відмові накопичувача.
RAID у сучасних дата-центрах
Сучасні enterprise-системи дедалі частіше переходять від класичного RAID до:
- distributed storage;
- erasure coding;
- software-defined storage.
Популярні рішення:
- Ceph
- ZFS
- VMware vSAN
Причини:
- краща масштабованість;
- вища відмовостійкість;
- ефективніше використання дискового простору.
Висновки
RAID залишається фундаментальною технологією у сфері зберігання даних. Правильно обраний рівень RAID дозволяє досягти оптимального балансу між продуктивністю, надійністю та ефективністю використання дискового простору.
Коротко:
- RAID 0 - продуктивність без захисту;
- RAID 1 - проста відмовостійкість;
- RAID 5 - компроміс між ємністю та безпекою;
- RAID 6 - підвищений захист;
- RAID 10 - найкращий вибір для критичних навантажень.
Під час проєктування інфраструктури важливо враховувати:
- тип навантаження;
- об’єм даних;
- швидкість відновлення;
- бюджет;
- вимоги до доступності сервісів.
При цьому RAID ніколи не повинен замінювати повноцінну систему резервного копіювання.