Рынок SDS: текущая ситуация, ожидания и перспективы

Обзор предложений

В настоящее время на рынке представлено большое количество продуктов, позиционируемых производителями как программно-определяемые системы хранения (Software Defined Storage – SDS). Для обзора существующих предложений целесообразно ввести классификацию, которая будет содержать критерии для сравнения представленных продуктов и позволит в первую очередь определить, относится продукт к SDS или нет.

Начнем с определения идеальной SDS. Программно-определяемая система хранения – это программное обеспечение, позволяющее использовать дисковые ресурсы стандартных вычислительных узлов (как правило, серверов архитектуры x86, x86-64), как это делается сейчас в традиционных системах хранения с жесткими дисками и SSD.

Под данное определение, с некоторыми оговорками, попадает большое количество продуктов. Разделим их на группы по характерным признакам.

Классические SDS

К этой группе мы относим продукты, которые изначально разрабатывались для объединения дисковых ресурсов серверов в единый пул. Общий признак таких SDS – масштабируемая (scale-out) архитектура, позволяющая наращивать производительность и объем дисковых ресурсов добавлением новых узлов.

CEPH. Продукт изначально разрабатывался как открытая распределенная файловая система и отказоустойчивое хранилище данных. Использование протокола TCP и серверов стандартной архитектуры определяет низкую стоимость хранения. Scale-out-архитектура и алгоритмы распределения данных по всем узлам кластера обеспечивают высокую производительность и отказоустойчивость. CEPH применяется хостинг-провайдерами в высокопроизводительных кластерах и в том случае, когда требуются масштабируемость свыше Пбайт данных, надежность и производительность. Как и многие другие продукты, разрабатываемые сообществом, внедрение и сопровождение CEPH обусловливают необходимость значительных трудозатрат высококвалифицированного персонала, поэтому его нельзя рассматривать как замену основной (general) системы хранения в корпоративном сегменте. В то же время продукт может с успехом использоваться в средах с типизированной нагрузкой и большими объемами данных.

Red Hat Storage Server. Разработанный одним из ведущих Linux-производителей на базе Red Hat Enterprise Linux продукт позиционируется как решение по хранению данных для частных, публичных и гибридных облачных сред, для хранения и эффективного использования медиаконтента, для высокопроизводительных вычислений. Этот продукт также можно отнести к классическим SDS.

Не обладая функционалом, необходимым для успешного применения бизнес-приложений, которым традиционно требуется блочный доступ, продукт обеспечивает высокую производительность в средах с большим количеством параллельных процессов ввода/вывода. Возможность гибкого масштабирования, простота замены вышедшего из строя оборудования и поддержка производителя обеспечивают надежную сохранность данных.

EMC ScaleIO. Обладает наиболее развитыми средствами развертывания и управления среди продуктов данной группы. EMC ScaleIO не только характеризуется высокими производительностью и масштабируемостью, но и способен заменить универсальную СХД среднего класса. Может быть использован как для решения многих типовых задач, так для бизнес-приложений, например баз данных. Следует отметить, что доступ к данным под управлением EMC ScaleIO можно получить только на уровне блочного устройства, с помощью специального драйвера.

Характеристики CEPH RedHat Storage EMC ScaleIO
Платформа Поддерживаемая архитектура x86/x86-64 x86/x86-64 x86/x86-64
Поддерживаемые ОС CentOS, Debian, Fedora, RHEL, Ubuntu RedHat Linux Microsoft Windows
Red Hat Enterprise Linux
CentOS Linux
SUSE Linux
Стоимость Схема лицензирования OpenSource, Коммерческая поддержка За узел За сырую емкость
Защита данных Возможность построения систем
с произвольной и гарантированной избыточностью
Да Нет Да
Удаленная асинхронная репликация Нет Да Нет
Самостоятельное восстановление Да Да Да
Мгновенные снимки Чтение Нет Чтение/Запись
Работа с «сырыми» дисками Да Нет Да
Шифрование данных Нет Нет Да
Гарантированное удаление данных Нет Нет Нет
Защита от удаления данных. Режим WORM Нет Да Нет
Функционал Интеграция с традиционными СХД Нет Нет Нет
Дедупликация Нет Нет Нет
Сжатие Нет Нет Нет
Flash-Cache Да Нет Нет
Многоуровневое хранение (Tiering) Нет Нет Да
Геораспределенные решения Нет Нет Нет
Интерфейс Объектный доступ S3, Swift Да Нет
Блочный доступ iSCSI, собственный клиент Нет Собственный клиент
Файловый доступ Драйвер файловой системы для Linux (kernel, FUSE) Драйвер файловой системы для Linux. (kernel, FUSE) Нет

SDS на основе традиционных систем хранения

SDS этой группы создаются путем выделения и адаптации программной составляющей традиционных СХД для серверов стандартной архитектуры без использования специального аппаратного обеспечения. При этом сохраняется функционал, присущий базовой системе хранения, и обеспечивается интеграция с традиционными СХД, на базе которых она разработана. Такой подход позволяет с максимальной эффективностью использовать преимущества SDS и функционал существующих СХД.

NetApp Data ONTAP Edge. Продукт дает возможность создать центр обработки данных на базе одного сервера. Устанавливаемая виртуальная машина на платформе VMware позволяет использовать внутренние диски сервера как систему хранения NetApp для виртуальных машин, развернутых на этом узле. Производитель рекомендует NetApp Data ONTAP Edge для передачи данных из удаленных офисов в центр и архивации их в системе хранения NetApp FAS. Таким образом, обеспечивается возможность использовать хорошо зарекомендовавшие себя технологии NetApp по репликации и зеркалированию данных между SDS и традиционными СХД. Применение этого решения ограничивается тем, что невозможно объединить ресурсы нескольких серверов и работать с объемом данных свыше 4 Тбайт.

HP StoreVirtual VSA. Решение от компании HP – яркий представитель SDS на основе традиционных систем хранения. HP StoreVirtual VSA для ОС HP Lefthand обладает богатейшим функционалом и может использоваться для создания программно-определяемых масштабируемых СХД. Стоит отметить такие возможности, как создание уровней хранения (tearing) и автоматическое перемещение данных между ними, защита данных и отсутствие единых точек отказа благодаря технологии Network RAID, работа со всеми ведущими гипервизорами VMware vSphere, Microsoft Hyper-V и KVM. Интеграция с системами развертывания ПО и облачными сервисами, а также доступность широкого спектра услуг поддержки HP делают данный продукт одним из наиболее универсальных. Он может применяться как провайдерами услуг, так и заказчиками из корпоративного сегмента.

Характеристики DataONTAP Edge HP StoreVirtual VSA HCP-VM (Virtual Machine)
Платформа Поддерживаемые гипервизоры VMware ESXi ESXi, Hyper-V, KVM VMware vSphere Hypervisor
Стоимость Схема лицензирования За узел За узел. Ограничение по объему на узел За емкость
Защита Данных Удаленная асинхронная репликация SnapMirror Да Да
Мгновенные снимки Чтение/Запись Чтение/Запись Чтение/Запись
Шифрование данных Нет Нет Да
Гарантированное удаление данных Нет Нет Да
Защита от удаления данных. Режим WORM Нет Нет Да
Производительность Ограничение по масштабированию емкости 10TB 50 ТБ/узел, 32 узла 40 узлов, 4,7ПБ
QoS Нет Да
Функционал Дедупликация Да Нет Да
Сжатие Да Нет Да
Многоуровневое хранение (Tiering) Нет Да Да
Геораспределенные решения Да Да Да
Интерфейс Объектный доступ Нет Нет S3, Swift
Блочный доступ iSCSI iSCSI Нет
Файловый доступ CIFS, NFS Нет HTTP, SMB, NFS, WebDAV

 

SDS в составе вычислительных комплексов

SDS данной группы позволяют совместить функцию виртуализации вычислительных ресурсов и виртуализацию хранения. Серверы, используемые в качестве хост-машин для виртуальной среды, оснащаются жесткими дисками, которые объединяются в SDS с помощью специализированного модуля гипервизора.

Решения группы «все в одном» обеспечивают гибкость и простоту масштабирования вычислительного комплекса, экономию на выделенной СХД. Вычислительными ресурсами, необходимыми для обработки запросов на хранения, систему обеспечивает хост-сервер.

Внедрение подобных решений позволяет заказчику трансформировать имеющуюся инфраструктуру в Software Defined Datacenter, добившись полной независимости от аппаратной конфигурации оборудования.

Характеристики Vmware vSAN Nutanix
Платформа Поддерживаемая архитектура x86/x86–64 Собственная x86 «все в одном» и сертифицированные серверы x86
Поддерживаемые гипервизоры VMware ESXi ESXi, Hyper-V, KVM
Стоимость Возможность использования общедоступных компонентов Да Нет. Обязательно наличие коммутаторов с низкими задержками
Схема лицензирования За CPU на сервере или для VDI за пользователя За узел
Защита данных Возможность построения систем
с произвольной и гарантированной избыточностью
Да Да
Удаленная асинхронная репликация Нет Да
Мгновенные снимки Нет Чтение/Запись
Шифрование данных Нет Да
Гарантированное удаление данных Нет Да
Производительность Автоматическая балансировка нагрузки между узлами Да Миграция данных «вслед за нагрузкой» в локальном кластере
Ограничение по масштабированию емкости 32 узла в кластере Неограниченный объем
Линейное масштабирование производительности Да Да
QoS Средствами VMware Да
Функционал Дедупликация Нет Да
Сжатие Да Да
Flash-Cache Да, обязательное требование – наличие Да
Многоуровневое хранение (Tiering) Нет Да
Интерфейс Объектный доступ Собственный интерфейс только для виртуальных машин vmware Нет
Блочный доступ Нет iSCSI
Файловый доступ Нет NFS

Программно-аппаратные комплексы

Данные решения, как правило, представляют собой законченный комплекс оборудования и программного обеспечения системы хранения. Они обладают большей надежностью и обеспечиваются расширенной технической поддержкой производителя, протестированы на совместимость и работают стабильно.

Как правило, эти системы служат трем основным целям.

  • Продление жизни существующих СХД путем виртуализации их емкости. Используя виртуальные системы хранения данных, заказчик абстрагируется от аппаратной составляющей и получает возможность выполнять обслуживание, миграцию и расширение емкости путем добавления новых систем прозрачно для приложения. Такие решения позволяют объединять небольшие системы хранения для увеличения объема, производительности и отказоустойчивости.
  • Расширение функционала существующих СХД. Как правило, система SDS обладает более широким спектром возможностей и позволяет работать с большинством аппаратных платформ. Системы дополняют уже существующие или системы низкого уровня богатым набором функций.
  • Создание единого пула ресурсов хранения. Единый пул обеспечивает возможность повысить эффективность хранения путем создания уровней хранения данных с автоматической миграцией, а также упрощает управление и мониторинг.
Характеристики IBM SVC HP StoreVirtual HITACHI CONTENT PLATFORM
Платформа Поддерживаемая архитектура Стандартный сервер IBM на базе x86-64 Стандартный сервер HP на базе x86-64 Стандартный сервер Hitachi Data Systems на базе x86-64
Защита данных Удаленная асинхронная репликация Да Да да
Мгновенные снимки Чтение/Запись Чтение/Запись Чтение/Запись
Шифрование данных Нет Нет Да
Гарантированное удаление данных Нет Нет Да
Защита от удаления данных. Режим WORM Нет Нет Да
Производительность Автоматическая балансировка нагрузки между узлами Да Нет Миграция данных «вслед за нагрузкой» в геокластере
Ограничение по масштабированию емкости 32 ПБ, 8 узлов 32 узла 80 ПБ, 80 узлов
Линейное масштабирование производительности Да Да Да
QoS Да Нет Да
Функционал Интеграция с традиционными СХД Да, IBM Storwzie Нет Интеграция с СХД Hitachi HUS, VSP, HNAS.
Дедупликация Нет Нет да
Сжатие Да Нет да
Многоуровневое хранение (Tiering) Да Да Да
Геораспределенные решения Да Да Да
Интерфейс Объектный доступ Нет Нет S3, Swift
Блочный доступ iSCSI, FC, FCoE FC, iSCSI Нет
Файловый доступ Нет CIFS, NFS, HTTP, FTP HTTP, SMB, NFS, WebDAV

Восприятие, информированность и востребованность программно-определяемых сред

Для заказчиков основными предпосылками к переходу на SDS являются:

  • более высокая стоимость аппаратных СХД по сравнению со стоимостью широко распространенных серверов;
  • централизация основных функций в ограниченном количестве контроллеров СХД и ограничение масштабирования систем.

Раньше считалось, что параллельные файловые системы предназначены для интернет-компаний или научных организаций, а сейчас подобное отношение переносится на SDS. Между тем некоторые из них обладают большим функционалом, сочетающимся с проработанными механизмами развертывания, и удобным пользовательским интерфейсом. Поэтому SDS – хороший выбор не только для компаний, чей бизнес основан на ИТ, но и для корпораций, которые являются потребителями традиционных СХД.

Основным преимуществом решений SDS заказчики считают низкую стоимость владения, которая может возрасти за счет увеличения затрат на поддержание работы системы в случае уникальных решений и непредсказуемой надежности аппаратных ресурсов.

Заказчикам знакомы решения от известных производителей, предлагающих SDS совместно с каким-либо хорошо зарекомендовавшим себя продуктом. Например, HP StoreVirtual VSA предлагается вместе с популярной и хорошо зарекомендовавшей себя аппаратной версией HP LeftHand p4000, а Data ONTAP Edge – для организации резервирования в центре данных из территориально удаленных офисов.

Некоторые производители заранее встраивают решения SDS в свои успешные продукты, избавляя заказчика и интегратора от необходимости проектирования и разработки собственных решений. В качестве примера можно привести VMware VSAN, которая предлагается вместе с vSphere для хранения виртуальных машин. Законченное решение по виртуализации представляет собой Nutanix, которая содержит собственный модуль хранения – NDFS. Компания RedHat включила в свой портфель продуктов opensource разработку GlusterFS под названием RedHat Storage, обеспечив коммерческой поддержкой.

Задачи

Решения SDS сегодня востребованы прежде всего там, где необходимо снизить до минимума цену емкости либо путем использования существующего парка устаревших серверов, либо за счет приобретения дешевого оборудования. Основные задачи, эффективно решаемые с помощью SDS:

  • хранение резервных копий или архивов;
  • среды разработки и тестирования;
  • облачные вычисления и хостинг.

При этом некоторые SDS уже могут применяться для решения более широкого спектра задач, таких как:

  • создание программно-определяемых центров обработки данных;
  • объединение существующих аппаратных ресурсов в единую систему хранения для повышения гибкости и отказоустойчивости;
  • создание модульных вычислительных сред на базе идентичных многофункциональных узлов;
  • расширение функционала существующих систем хранения данных. Объединение нескольких систем хранения данных в единый пул ресурсов;
  • создание уникальных решений с высоким уровнем отказоустойчивости, производительности и эффективности.

Ожидания и перспективы

Внедряя SDS, заказчики ожидают от инфраструктуры:

  • снижения стоимости – экономия в существующей сложной ситуации на рынке;
  • повышения производительности – построение высокопроизводительных систем без покупки СХД класса Hi-End;
  • расширения функционала – получение функционала традиционных СХД для решений, в которых нецелесообразно применение реальных СХД.

При этом большинство ожидает, что программно-определяемые системы хранения данных будут иметь следующие характеристики.

Гибкость (flexibility). Благодаря поддержке большинства распространенных аппаратных платформ системы SDS позволят практически мгновенно добавлять или заменять узлы хранения без привязки к производителю оборудования, форм-фактору. Сроки разработки нового функционала в программно-определяемых системах хранения заметно ниже, чем для создания новой аппаратной платформы, поддерживающей требуемый функционал.

Виртуализация ресурсов (Resource Virtualization). Функционал системы не привязан к аппаратным компонентам. Это обеспечит замену и обслуживание компонентов без остановки системы, а также снижение затрат на управление разрозненной инфраструктурой. Возможность совмещения программно-определяемых подсистем хранения с подсистемами виртуализации вычисления и сети позволяет повысить утилизацию ресурсов.

Интерфейс программирования (APIs). Программно-определяемые системы хранения предоставляют широкий функционал и большой набор интерфейсов взаимодействия со смежными системами, позволяя создавать законченные решения, автоматизировать рутинные процессы, снижая риск ошибки и сокращая затраты.

Удобство управления (Ease of Management). SDS предоставит пользователю единую точку входа для управления всей подсистемой хранения, исключив необходимость настройки отдельных компонентов.

Замена компонентов (Component Replacement). Программно-определяемые среды дают возможность абстрагироваться от аппаратных ресурсов и производить замену, миграцию и обслуживание компонентов практически без снижения производительности и прерывания сервиса.

Поделиться:
Спецпроект

Напряженный трафик или Современные требования к инфраструктуре ЦОД

Подробнее
Спецпроект

Специальный проект "Групповой спутниковый канал для территориально-распределенной сети связи"

Подробнее

Подпишитесь
на нашу рассылку