Сеть хранения данных

Материал из Википедии — свободной энциклопедии
(перенаправлено с «SAN»)
Перейти к навигации Перейти к поиску

Сеть хранения данных (англ. Storage Area Network, SAN) представляет собой архитектурное решение для подключения внешних устройств хранения данных, таких как дисковые массивы, ленточные библиотеки, оптические приводы к серверам таким образом, чтобы операционная система распознала подключённые ресурсы как локальные[источник не указан 506 дней].

SAN характеризуются предоставлением так называемых сетевых блочных устройств (обычно посредством протоколов Fibre Channel, iSCSI или AoE), в то время как сетевые хранилища данных (англ. Network Attached Storage, NAS) нацелены на предоставление доступа к хранящимся на их файловой системе данным при помощи сетевой файловой системы (такой как NFS, SMB/CIFS, или Apple Filing Protocol). При этом категоричное разделение SAN и NAS является искусственным: с появлением iSCSI началось взаимное проникновение технологий с целью повышения гибкости и удобства их применения (например, в 2003 году NetApp уже предоставляли iSCSI на своих NAS, а EMC и HDS — наоборот, предлагали NAS-шлюзы для своих SAN-массивов[1]).

Типы сетей

[править | править код]
SAN-Свитч[англ.] Qlogic SANbox 5600 с подключёнными к нему оптическими разъёмами Fibre Channel

Большинство сетей хранения данных использует протокол SCSI для связи между серверами и устройствами хранения данных на уровне шинной топологии. Так как протокол SCSI не предназначен для формирования сетевых пакетов, в сетях хранения данных используются низкоуровневые протоколы:

Также используется протокол NVMe over Fabrics, обеспечивающий доступ по сетевому расширению протокола NVMe.

Совместное использование устройств хранения

[править | править код]

Толчком для развития сетей хранения данных стал взрывной рост объёма деловой информации (такой как электронная почта, базы данных и высоконагруженные файловые серверы), требующая высокоскоростной доступ к дисковым устройствам на блочном уровне. Ранее на предприятии возникали «острова» высокопроизводительных дисковых массивов SCSI. Каждый такой массив был выделен для конкретного приложения и виден ему как некоторое количество томов (LUN).

Сеть хранения данных позволяет объединить эти «острова» средствами высокоскоростной сети. Также без использования технологий SCSI транспорта невозможно организовать отказоустойчивые кластеры, в которых один сервер подключается к двум и более дисковым массивам, находящимся на большом расстоянии друг от друга на случай стихийных бедствий[источник не указан 506 дней].

Сети хранения помогают повысить эффективность использования ресурсов систем хранения, поскольку дают возможность выделить любой ресурс любому узлу сети.

Не стоит забывать и об устройствах резервного копирования, которые также подключаются к SAN. В данный момент[уточнить] существуют как промышленные ленточные библиотеки (на несколько тысяч лент) от ведущих брендов[уточнить], так и решения для малого бизнеса. Сети хранения данных позволяют подключить к одному хосту несколько приводов таких библиотек, обеспечив таким образом хранилище данных для резервного копирования от сотен терабайт до нескольких петабайт.

Преимущества

[править | править код]

Совместное использование систем хранения, как правило, упрощает администрирование и добавляет изрядную гибкость, поскольку кабели и дисковые массивы не нужно физически транспортировать и перекоммутировать от одного сервера к другому.

Другим преимуществом является возможность загружать сервера прямо из сети хранения. При такой конфигурации можно быстро и легко заменить сбойный сервер, переконфигурировав SAN таким образом, что сервер-замена будет загружаться с LUN'а сбойного сервера. Эта процедура может занять, например, полчаса[2]. Идея относительно новая, но уже используется в новейших датацентрах.

Дополнительным преимуществом является возможность на хосте собрать RAID-зеркало из LUNов, которые презентованы хосту с двух разных дисковых массивов. В таком случае полный отказ одного из массивов не навредит хосту.

Также сети хранения помогают более эффективно восстанавливать работоспособность после сбоя. В SAN может входить удаленный участок со вторичным устройством хранения. В таком случае можно использовать репликацию, реализованную на уровне контроллеров массивов, либо при помощи специальных аппаратных устройств. Поскольку каналы WAN на основе протокола IP встречаются часто, были разработаны протоколы FCIP[англ.] и iSCSI с целью расширить единую SAN средствами сетей на основе протокола IP. Спрос на такие решения значительно возрос после событий 11 сентября 2001 года в США[источник не указан 506 дней].

Сравнение технологий обмена данными

[править | править код]
Различия между NAS и SAN
Различия между NAS и SAN

Порой сравнивают SAN и NAS, говоря на самом деле о разнице между сетевым диском и сетевой ФС, которая состоит в том, кто обслуживает файловую систему, хранящую данные.

В случае сетевого диска (также «блочного устройства», англ. block device):

  • обмен данными с ним по сети осуществляется блоками подобно тому, как и с локальным SCSI- или SATA-диском;
  • файловая система, если нужна, создаётся и управляется клиентом и, как правило, используется им одним.

В случае сетевой файловой системы («ресурс с совместным/разделяемым доступом» — не хранит, а только передаёт данные):

  • обмен данными по сети происходит с применением более высокоуровневых понятий «файл» и «каталог», соответствующих объектам подлежащей «настоящей» ФС на физических дисках (либо логических поверх них в случае применения RAID, LVM);
  • эта файловая система создаётся и обслуживается в рамках удалённой системы, при этом может одновременно использоваться на чтение и запись множеством клиентов.

Топология сети

[править | править код]

Однокоммутаторная структура

[править | править код]
Однокоммутаторная структура

Однокоммутаторная структура (англ. single-switch fabric) состоит из одного коммутатора Fibre Channel, сервера и системы хранения данных. Обычно эта топология является базовой для всех стандартных решений: другие топологии создаются объединением однокоммутаторных ячеек[3].

Дерево или каскадная структура

[править | править код]
Каскадная структура

Каскадная структура (англ. cascaded fabric) — набор ячеек, коммутаторы которых соединены в дерево с помощью межкоммутаторных соединений (англ. Inter-Switch link, ISL). Во время инициализации сети коммутаторы выбирают «верхушку дерева» (англ. principal switch, главный коммутатор) и присваивают ISL’ам статус «upstream» (вверх) или «downstream» (вниз) в зависимости от того, ведет этот линк в сторону главного свитча или на периферию.

Решетка

Решётка (англ. meshed fabric) — набор ячеек, коммутатор каждой из которых соединен со всеми другими. При отказе одного (а в ряде сочетаний — и более) ISL-соединения связность сети не нарушается. Недостаток — большая избыточность соединений.

Кольцо

Кольцо (англ. ring fabric) практически повторяет схему топологии решётки. Среди преимуществ — использование меньшего количества ISL-соединений.

Центрально-распределённая

[править | править код]
Центрально-распределённая

Центрально-распределённая топология (англ. core-edge fabric) практически повторяет схему топологии решётки. Среди преимуществ — меньшая избыточность соединений и высокая степень отказоустойчивости.

Примечания

[править | править код]
  1. iSCSI’s Effect on the Eternal NAS vs. SAN Debate. Дата обращения: 7 апреля 2010. Архивировано из оригинала 11 ноября 2006 года.
  2. Сильно зависит от масштабов проблемы. В континентальном кластере, например, считается, что если за сутки удалось восстановить сервис, то уже хорошо. Основное время занимает согласование запуска нового сервера с высшим руководством.
  3. HP SAN DESIGN GUIDE. Дата обращения: 14 сентября 2007. Архивировано из оригинала 23 января 2007 года.