Эволюция СХД: гибридные системы, умный Flash, программные решения

 

Николай Рысев, инженер отдела системной интеграции, ЗАО «Тринити»
Николай Рысев,
инженер отдела системной интеграции, ЗАО «Тринити»

По статистике, объемы хранимых данных ежегодно увеличиваются на 50–80%: Big Data, всевозможная аналитика и прочие потребности бизнеса вынуждают разработчиков дата-центров искать новые, более совершенные решения. Но растут не только объемы данных – постоянно повышаются требования к скорости их обработки, к безопасности и доступности. Именно эти тенденции и определяют развитие технологий хранения данных в последние несколько лет.

 

Что нужно бизнесу?

Для каждого типа заказчиков характерны специфичные профили нагрузки, в зависимости от которых и подбирается то или иное решение. Для работы нагруженных СУБД необходимы минимальные задержки и большое количество операций ввода-вывода в секунду (IOPS), что в текущих реалиях очень хорошо обеспечивают All-Flash-решения и гибридные массивы.

С точки зрения планирования очень важно не ошибиться с уровнем приобретаемой СХД, поскольку Low-End-решения, например, не способны масштабироваться за пределы двух контроллеров и относительно небольшого количества полок расширения, что может стать бутылочным горлышком в процессе роста.

Большинству заказчиков – банкам, облачным провайдерам, государственным структурам, различным производственным компаниям – важны правильное планирование и постепенное наращивание емкости и производительности СХД. Не менее значимыми критериями являются скорость работы и стоимость.

Решать эти задачи одним лишь наращиванием аппаратных мощностей сегодня практически невозможно, поэтому на помощь приходится призывать интеллектуальные решения – программное обеспечение, которое будет руководить «железом».

Гибкость и масштабируемость

Основные требования, которые бизнес предъявляет к хранилищам данных, – это гибкость и масштабируемость. Параллельно с наращиванием вычислительных ресурсов для запуска виртуальных машин (VM) такие решения должны быть готовы к линейному росту, как по производительности, так и по емкости.

Такую возможность сейчас предоставляют SDS (Software Defined Storage) – программно-определяемые хранилища. SDS – основной тренд последних лет. Четкого определения у этого подхода пока нет, поскольку существуют различные реализации. В целом «программно-определяемый» значит «независимый от «железа»: бэкендом в данном случае выступают не дорогие брендовые дисковые полки, а набор серверов с локальными дисками и быстрым интерконнектом (например, 10 Gb Ethernet), поверх которых крутится самая интересная составляющая – ПО хранения данных, которое управляет инфраструктурой хранения.

Скорость работы и доступа к данным

Скорость обработки, «переваривания» данных – одно из важных требований, наилучшим образом с которым справляются All-Flash-массивы.

Модели СХД, полностью построенные на Flash-накопителях, не просто заменяют собой традиционные и гибридные системы хранения. Массивы All-Flash продолжают двигаться в сторону специализированных и достаточно интеллектуальных Flash-модулей на быстрой шине, что дает возможность повысить ресурс ячеек и заметно снизить задержки. Именно крайне низкие задержки в сочетании с огромными значениями IOPS и стали ключевым преимуществом «киллер-фичей» таких систем.

Обычные SSD уже практически не встречаются в All-Flash, за исключением бюджетных в этом классе СХД. Однако многоуровневое хранение (Tiering) по-прежнему пользуется спросом. Там, где важны не только скорость, но и стоимость, можно разделять данные на часто и редко используемые, размещая первые на SSD и Flash-носителях, а вторые – на обычных, более дешевых и менее производительных HDD.

Многие производители СХД используют программные решения при обработке данных в реальном времени для сжатия и/или дедупликации на лету. Благодаря грамотной реализации посредством эффективного кода и специализированных интегральных схем специального назначения (ASIC) эти алгоритмы позволяют при относительно небольшом увеличении задержек заметно снизить нагрузку на бэкенд и повысить как эффективность хранения данных, так и производительность.

Некоторые вендоры продолжают развивать технологии виртуализации систем хранения, за счет чего упрощается управление инфраструктурой хранения (особенно многовендорной), продляется жизненный цикл уже купленных СХД и т. д.

Стоимость хранения

В настоящее время удешевление Flash-массивов продолжается, хотя цены падают уже не столь стремительно, как это было ранее. Потребительские продукты SSD с технологиями удешевления вроде многоуровневых ячеек слишком ненадежны для систем хранения, где постоянно происходит перезапись.

Конфигурации СХД все чаще стали смещаться в сторону гибридных решений с несколькими уровнями хранения (например, SLC SSD – MLC SSD – SAS – NL-SAS) и с автоматическим перемещением блоков данных между ними. Это позволяет снизить общую стоимость при сохранении высокого уровня производительности, поскольку «горячие» данные, как правило, составляют относительно небольшой процент общего объема.

Снизить стоимость хранения помогают и традиционные программные технологии – дедупликация и компрессия данных. В сочетании с многоуровневым хранением они могут обеспечить дополнительную эффективность.

Важная тенденция последних лет, связанная с удешевлением СХД, – это размытие границ между решениями начального и среднего уровней. Так, в Low-End постепенно переходят технологии из Midrange, например Tiering, репликация по IP, возможность создания All-Flash массивов, технологии виртуализации, пусть и ограниченные.

Существенными отличиями Midrange-решений остаются масштабируемость и, как следствие, производительность, менее заметными – функциональность, что проявляется прежде всего в самом востребованном среднем классе, ну и, разумеется, стоимость.

А High-End-системы, в традиционном понимании этого класса, меняются слабо и довольно консервативно. Основные их отличия от более низких сегментов рынка СХД – масштабируемость до впечатляющих объемов (ПБ), нацеленность на максимально низкие задержки и консистентность данных, разнообразные продвинутые технологии репликации для обеспечения непрерывности, а также стабильные и предсказуемые задержки.

Прошлое и будущее

Современные интеллектуальные программные решения хороши тем, что они способны поддерживать унаследованное оборудование, оптимизируя тем самым стоимость и производительность. Так, виртуализация СХД решает большинство унаследованных проблем. Путем виртуализации имеющихся массивов можно значительно увеличить производительность в целом, обеспечить существующие системы хранения дополнительными, недоступными ранее функциональными возможностями и продлить им жизнь за счет использования некритичного или небыстрого уровня хранения.

Большинство производителей СХД, кроме консерваторов, также постепенно внедряют новые функциональные возможности в ПО, которое становится доступным (за исключениями, связанными с возможностями «железа» той или иной модели) для всей линейки этого вендора.

Унаследованное оборудование еще долго будет использоваться в СХД. Главные козыри ленточных накопителей: низкая стоимость хранения, высокая линейная скорость записи, длительный гарантированный срок хранения, устойчивость к внешнему воздействию, нулевое потребление электричества при отсутствии ввода-вывода. Однако ленточные накопители неприменимы для ситуаций, где требуется случайный доступ к данным. Если существует потребность в подобном паттерне в вопросах резервного копирования и архивации, а также интеграции с существующим ПО, использующим ленты, стоит рассмотреть виртуальные библиотеки с хранением на дисках (VTL).

Однако не все новейшие технологии отработаны настолько, чтобы применяться в критически важных корпоративных приложениях. Например, не так давно появились гибридные распределенные СХД, объединяющие локальные и облачные ресурсы хранения. Этот перспективный подход позволяет быстро и эффективно масштабировать хранилище данных.

Но в нашей стране сложилась необычная для остального мира ситуация с использованием облачных ресурсов: многие заказчики предпочитают держать данные при себе. В лучшем случае у нас реализована репликация данных между собственной площадкой и арендуемым оборудованием стороннего дата-центра. Но чаще всего облачные ресурсы используются в схемах с хранением в облаке некритичных данных (зашифрованные резервные копии, архивы).

Преждевременно говорить и об импортозамещении в сфере хранения данных. Конечно, в России есть несколько компаний, которые производят интересные продукты, но они еще не универсальны и решают лишь ряд задач. Тем не менее определенные перспективы у этого направления, безусловно, имеются.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку