Почему Flash побеждает в корпоративных СХД

Сергей Караханов,
инженер-проектировщик центра компетенций по вычислительным комплексам, компания «Техносерв»

Какие основные стратегии преследует все живое на нашей планете? Правильно, выживание и размножение! Согласно теории эволюции выживают и продолжают свое существование только самые сильные, быстрые, умные, здоровые и нужные природе особи. Подчиняется ли этим законам также неживое и созданное человеком? Я думаю, что да.

 

В корпоративных сетях передачи данных де-факто самым популярным и, пожалуй, единственным выжившим протоколом канального уровня стал Ethernet, а на сетевом уровне – IP.

В сфере хранения данных тоже происходит эволюция технологий. Какие требования традиционно предъявляются к корпоративным системам хранения данных? Высокая производительность и доступность данных, приемлемая стоимость, удобство и легкость эксплуатации. Но сегодня уже недостаточно удовлетворения только этих требований: компании хотят, чтобы собранная и хранящаяся у них информация не лежала мертвым грузом, а непрерывно работала и приносила прибыль, и потому все чаще им требуются анализ и обработка больших объемов данных в реальном времени.

 

Твердотельные диски побеждают

Можно сделать предварительный вывод, что одной из основных задач в сфере развития корпоративных СХД является увеличение их производительности при сохранении приемлемой стоимости. Для решения такой задачи отлично подходят All-Flash-системы. Что же сделало применение Flash-накопителей столь привлекательным? Ответ очевиден:  увеличение производительности и емкости при значительном снижении стоимости.

Исторически повышение производительности процессоров осуществлялось значительно быстрее увеличения производительности подсистемы ввода-вывода. Только в начале 2010-х гг. стали доступны высокопроизводительные SSD-диски. Однако их объем был настолько скромным, а стоимость настолько большой, что использование таких дисков в корпоративных СХД было нецелесообразным. Спустя несколько лет Flash-накопители стали более доступными, а благодаря гораздо большему объему стала возможна замена ими HDD-дисков. С тех пор тенденции на рынке корпоративных СХД изменились.

В современных системах хранения данных на смену HDD-дискам пришли SSD-, NVMe- и NVDIMM-накопители. Время обработки операций ввода-вывода теперь исчисляется не миллисекундами, а микро- и даже наносекундами. Это стало возможным благодаря определенным технологическим изменениям.

Во-первых, усовершенствованная технология производства Flash-памяти 3D NAND позволила изменить алгоритм записи в ячейку и вместо трех операций, выполняемых ранее в 2D NAND, производить одну. Во-вторых, произошел переход от традиционных протоколов и интерфейсов подключения Flash-накопителя (например, SATA или SAS) к интерфейсу PCIe. При таком подходе хранилище находится максимально близко к вычислительному центру и центральному процессору, что позволяет уменьшить время выполнения операций ввода-вывода и, как следствие, ускорить решение бизнес-задач. В-третьих, увеличилась пропускная способность сетей хранения данных. Стали доступными сети 100 Гб/с Ethernet, 100 Гб/с Infiniband, NVMe over Fabric, NVMe over PCI-Express. Пока еще не все производители корпоративных СХД поддерживают эти технологии, но существующая тенденция обусловливает необходимость их использования.

Тенденции развития нанотехнологий, усовершенствования Flash-памяти, уплотнения ячеек хранения информации привели к тому, что емкость современных SSD-дисков уже превышает емкость HDD-дисков. Первым производителем корпоративных СХД, поддерживающих SSD-диски объемом 15 ТБ, стала компания NetApp. Сегодня NetApp уже заявляет о поддержке SSD-дисков емкостью 30 ТБ. 3D NAND-технология позволила в разы увеличить количество ячеек на единицу объема кристалла и соответственно емкость Flash-накопителя. Тенденция увеличения слоев в чипах памяти 3D NAND сохраняется, так что, скорее всего, в ближайшие два-три года емкость Flash-накопителей увеличится еще в несколько раз.

Остается актуальным вопрос долговечности Flash-накопителей. За счет более плотного расположения ячеек памяти в кристалле границы между ячейками становятся меньше, а слои активных материалов тоньше. Как следствие, под воздействием электрического напряжения материалы теряют свою исходную прочность и свойства. После определенного количества операций перезаписи данных в ячейку она выходит из строя. Для продления срока действия Flash-накопителя используются разные технологии: равномерная запись данных во все ячейки памяти, Garbage Collection, механизмы коррекции ошибок, добавление резервных чипов памяти на плату Flash-накопителя. Технологии дедупликации и компрессии, имеющиеся в большинстве корпоративных СХД, позволяют уменьшить объем данных, которые необходимо записывать на диски и тем самым способствуют продлению их срока службы. Более того, эти технологии влияют на эффективность использования дискового пространства, снижая стоимость All-Flash-решений.

Что же касается стоимости, то и она благоприятствует внедрению систем хранения данных на Flash-накопителях. Если верить отчетам всевозможных аналитических компаний, то уже в 2021 г. количество продаж твердотельных накопителей превысит количество продаж жестких дисков. Это станет возможным исключительно за счет снижения стоимости производства твердотельных накопителей до того уровня, когда затраты на покупку Flash-системы окупаются выгодой, которую такая система приносит компании.

 

Корпоративные системы хранения

С Flash-накопителями все понятно: развиваются они бойко и популярность их растет. А как они влияют на развитие корпоративных систем хранения данных? Ответ: напрямую. Если еще несколько лет назад наиболее популярными решениями были гибридные СХД, хранилище которых построено на HDD- и SSD-дисках, то сегодня становятся распространенными All-Flash СХД. Основной их плюс – в гарантированной высокой производительности и минимальном времени отклика, что существенно помогает при проектировании и эксплуатации. Если при создании хранилища на HDD-дисках требуются тщательный расчет, учет влияния на производительность скорости вращения диска типа RAID, профиля нагрузки, то с All-Flash все намного проще. После того как стало ясно, что применение All-Flash обосновано под требуемый тип нагрузки, достаточно рассчитать требуемую полезную емкость и способ подключения СХД к серверу. Как уже было сказано, дисковая подсистема на Flash-накопителях теперь не является узким местом, и скорее будут утилизированы контроллеры СХД, чем диски.

Также можно выделить экономичность All-Flash-систем по затратам электропитания и охлаждения в сравнении с традиционными СХД. Экономия обусловлена отсутствием вращающихся деталей и меньшим выделением тепла. Если использовать SSD-диски емкостью 15 или 30 ТБ, то в одной дисковой полке 2U можно получить примерно 600 ТБ полезной емкости! Для достижения аналогичной емкости с использованием дисков NL-SAS 6 ТБ потребуются шесть дисковых полок по 3U, т. е. обеспечивается значительная экономия на инфраструктуре.

Помимо выделенных систем хранения данных, которые подключаются к серверным узлам по сети, популярны программно-определяемые хранилища и гиперконвергентные решения. Среди них также встречаются All-Flash. Стоимость Flash-накопителей в составе серверов может быть в два раза ниже, чем их стоимость в составе СХД, да и сами серверы можно подобрать из недорогих. Таким образом, достигается существенная экономия средств при внедрении системы. За счет того, что диски взаимодействуют с сервером локально, да если еще с подключением через PCIe-интерфейс, то можно обеспечить очень высокую производительность подсистемы ввода-вывода.

В пользу выделенных (классических) СХД в этом случае можно сказать следующее. Во-первых, они предлагают централизованное хранение данных разных систем, обеспечивая безопасность и надежность хранения, а также эффективность за счет применения дедупликации и компрессии всех корпоративных данных. Во-вторых, необходимо учитывать взаимодействие СХД с компонентами ИТ-инфраструктуры. Например, резервное копирование данных с СХД происходит в разы быстрее и не нагружает продуктивные серверы. В-третьих, приобретая СХД, вы получаете гарантию от производителя как на аппаратную, так и на программную части. При использовании самостоятельно спроектированного решения с хранением данных на серверах ответственность ложится на проектировщика, в то время как СХД проектируются командами профессионалов с многолетним опытом, системы качественно тестируются и в них устраняются все известные проблемы.

 

Автоматизация, искусственный интеллект и облака

Следует сказать еще о нескольких тенденциях, которые свойственны не только All-Flash-системам, но и всем корпоративным СХД в целом (да и вообще многим современным продуктам на рынке). Связаны они с улучшением сервиса и удобством использования. С каждым годом производители создают все больше вспомогательных инструментов для внедрения, управления и мониторинга СХД. Если несколько лет назад для запуска системы требовался хорошо обученный персонал с большим опытом работы в области хранения данных, то сегодня эти требования значительно снижены. Достаточно скачать необходимый инструмент для инициализации СХД, собрать требуемые данные (как правило, набор IP-адресов) и запустить автоматизированный процесс настройки. Для администрирования систем производители разрабатывают все более удобные и интуитивно понятные графические интерфейсы. За счет этого можно значительно снизить затраты на внедрение и администрирование. Возможно, через пять-десять лет отпадет необходимость держать в штате администратора СХД – задача по администрированию как СХД, так и других компонентов ИТ-инфраструктуры (серверы, виртуализация, резервное копирование) будет решаться одним человеком.

Между тем становятся популярными системы мониторинга с применением технологий искусственного интеллекта, которые с высокой вероятностью способны предсказывать сбой. Благодаря этому можно заблаговременно заменить изношенную или близкую к поломке деталь либо обновить программное обеспечение. Как следствие, увеличивается непрерывность работы систем и значительно снижается количество сбоев. Одним из лидеров в данном направлении является хранилище Nimble Storage. Благодаря платформе прогнозной аналитики Nimble Storage InfoSight СХД по всему миру отправляют статистику в единый центр обработки с искусственным интеллектом. Производитель может отслеживать состояние всех выпущенных СХД, анализировать и коррелировать их поведение, возникновение сбоев или выявлять проблемы в микрокоде.

С повышением спроса на облачные сервисы All-Flash-хранилища распространяются и в этой сфере. Как правило, в облаках используются упомянутые выше гиперконвергентные и программно-определяемые хранилища. Если говорить о корпоративных СХД, то они могут использоваться для предоставления облачных услуг. Здесь помимо предоставления хранилища как такового применяется технология виртуализации СХД, благодаря которой заказчики могут получать в пользование определенную виртуальную часть физической СХД. При помощи технологии виртуализации сетей обеспечивается разграничение сетевого доступа, а применение технологии качества обслуживания (QoS) гарантирует производительность ввода-вывода в условиях конкуренции за общие ресурсы. Для особо требовательных к производительности заказчиков All-Flash-решение подойдет лучше всего, поскольку изначально невозможно учесть требования к производительности и профиль нагрузки потенциальных клиентов.

 

***********************************

В заключение стоит отметить, что увеличение объема данных и требования к производительности СХД диктуют необходимость перехода на All-Flash-системы, а снижение цен на них ускоряет этот закономерный процесс.

 

 

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку