Часть 18: Программно определяемые системы хранения данных (SDS) - github2wiki/SPBSUT_KURS GitHub Wiki
Система хранения данны
Система хранения данных это комплексное программно-аппаратное решение по организации надёжного хранения информационных ресурсов и предоставления гарантированного доступа к ним.
Классифицировать СХД можно по разному
По типу организации хранения данных
Существует несколько видов СХД, вот некоторые из них Виды СХД
- Direct-attached storage (DAS)
- Network-attached storage (NAS)
- Storage area network (SAN)
По способу хранения данных
Block storage
Файлы разбиваются на «кусочки» одинакового размера, каждый с собственным адресом, но без метаданных. Хранение на уровне блоков лежит в основе работы традиционного жесткого диска.Пример — ситуация, когда драйвер HDD пишет и считывает блоки по адресам на отформатированном диске. Такие СХД используются многими приложениями, например, большинством реляционных СУБД. В сетях доступ к блочным хостам организуется за счет SAN с помощью протоколов Fibre Channel и iSCSI.
Плюсы
- Блочные хранилища обладают набором инструментов, которые обеспечивают повышенную производительность: хост-адаптер шины разгружает процессор и освобождает его ресурсы для выполнения других задач. Поэтому блочные системы хранения часто используются для виртуализации. Также хорошо подходят для работы с базами данных.
Минусы
- Недостатками блочного хранилища являются высокая стоимость и сложность в управлении. Еще один минус блочных хранилищ (который относится и к файловым, о которых далее) — ограниченный объем метаданных. Любую дополнительную информацию приходится обрабатывать на уровне приложений и баз данных.
File storage
Здесь, данные хранятся как файлы и папки, собранные в иерархическую структуру, и доступны через клиентские интерфейсы по имени, названию каталога и др.
Плюсы
Среди плюсов файловых хранилищ выделяют простоту. Файлу присваивается имя, он получает метаданные, а затем «находит» себе место в каталогах и подкаталогах. Файловые хранилища обычно дешевле по сравнению с блочными системами, а иерархическая топология удобна при обработке небольших объемов данных. Поэтому с их помощью организуются системы совместного использования файлов и системы локального архивирования.
Минусы
Основной недостаток файлового хранилища — отсутсвие масштабируемости.По мере накопления большого количества данных — находить нужную информацию в куче папок и вложений начинает занимать всё больше и больше времени. По этой причине файловые системы хранения не используются в дата-центрах, где важна скорость.
Object storage
Отличаются от файловых и блочных отсутствием файловой системы. Древовидную структуру файлового хранилища здесь заменяет плоское адресное пространство. Никакой иерархии — просто объекты с уникальными идентификаторами, позволяющими пользователю или клиенту извлекать данные
Плюсы
Масштабируемость, расширяемость метаданных, высокая скорость доступа к информации
Software-defined storage (SDS)
SDS — это архитектура хранения, которая использует уровень программного обеспечения для выделения ресурсов и управления ею на серверах. Главный принцип таких систем — полный перенос организации хранения с аппаратных контроллеров на программный уровень. Программно-определяемое хранилище, по сути, является программным обеспечением для хранения орагнизации хранения данных ,обеспечения безопасности на основе политик и управления хранением данных независимо от аппаратных средств. Программное обеспечение, позволяющее создать среду хранения, может также обеспечивать управление для таких функций, как дедупликация данных, репликация,моментальные снимки и резервное копирование.
Причины появления
Главная причина воявления SDS — желание избавиться от зависимости, связанной с использованием оборудования одного вендора, гибко наращивать (или сокращать) применяемые ресурсы, решать новые функциональные задачи, а в итоге добиться сокращения эксплуатационных затрат при росте эффективности использования вычислительных мощностей.
SDS-системы, архитектурно повторяющие классические массивы, имеют аналогичные технические ограничения: фиксированное количество контроллеров (нод), интерфейсных портов взаимодействия и накопителей (жестких дисков, SSD).
Но переход на программно-определяемую реализацию функционала сделал возможным использование технологий, которые ранее были недоступны(например, виртуализация внешних дисковых массивов). Включение продуктов на основе SDS в наборы решений позволило производителям значительно увеличить функционал в этих сегментах.
Наибольшие популярность и распространение на данный момент имеют SDS-продукты с объектным принципом хранения данных. Их основные потребители – средние и крупные сервисные провайдеры услуг по облачному хранению: Dropbox, Amazon, Google, Apple и др.
В случае частных облаков применение объектного подхода гарантирует унификацию вычислительных компонентов и динамическое расширение инфраструктуры за счет добавления универсальных новых нод (серверов), которые могут обеспечивать сервис хранения одновременно с другими ролями.
В отличие от классических решений, которые отвечают за гарантированное хранение всего массива данных (в рамках одного ресурса), объектный принцип предусматривает хранение множества копий частей массива данных – так называемых объектов.
Сохранность данных обеспечивается при доступности хотя бы одного экземпляра из множества. За счет применения объектного хранения стала возможна организация резервирования данных в зависимости от места расположения элементов SDS. Например, можно дублировать объекты на ресурсах разных узлов (серверов – участников SDS), размещенных в разных стойках ЦОД. Исходя из этого, допускается потеря части компонентов при условии сохранения одной или более копий каждого из объектов.
Основные преимущества
- Экономичность
Программно-определяемые хранилища дают возможность отказаться как от проприетарных решений в пользу стандартизированного оборудования, так и от традиционной сети хранения данных (SAN) Fibre Channel в пользу более универсального стандарта Ethernet.
- Гибкость
Программно-определяемые хранилища могут быть построены на оборудовании любого производителя или даже различных производителей в рамках одной системы. SDS легко масштабируются, поскольку программный уровень организации предоставляет очень широкие возможности по управлению ресурсами.
- Отказоустойчивость
При возникновении проблем на основной SDS с помощью средств репликации данные легко переносятся резервную систему.
- Производительность
Программно-определяемые хранилища поддерживают подключение PCIe NVMe-карт, существенно увеличивающих возможности систем.
SDS решения
- Ceph
Универсальная SDS, позволяющая реализовать блочный, файловый и объектный доступ к данным в пределах одной системы. Благодаря поддержке асинхронной репликации имеет сравнительно более низкие требования к скорости передачи данных. Еще одним преимуществом Ceph является отсутствие ограничений на масштабирование узлов.
- GlusterFS
Среди программно-определяемых хранилищ GlusterFS выделяется более простой настройкой и поддержкой. Многоуровневый подход к хранению данных предполагает использование уже испытанных файловых систем на реальных дисках. GlusterFS может легко масштабироваться до петабайт дискового пространства, которое доступно пользователю под одной точкой монтирования. В отличие от других распределённых файловых систем, GlusterFS не требует отдельный сервер для хранения метаданных.
- VMmware Virtual San
SDS от VMware встроена в лидирующий на корпоративном рынке гипервизор vSphere, что облегчает первичную настройку и последующее управление. Решение предлагает отличную производительность, возможность построения «растянутых» кластеров серверов виртуализации или развертывания в филиалах всего на двух серверах.
- SANsymphony
Система от DataCore позволяет виртуализовать существующие СХД, увеличить их производительность за счет кэширования в оперативной памяти или на твердотельных дисках, создавать распределенные программные хранилища на базе дисков, установленных локально в серверы.