Экономика традиционной СХД-инфраструктуры и специфика SDS

Тенденции отрасли хранения данных

Сложная экономическая ситуация отбрасывает нас назад относительно прогнозов развития рынка СХД в России, которые давали аналитические агентства в начале прошлого года. Модная сегодня тема импортозамещения не в состоянии заменить в краткосрочной перспективе значительный технологический разрыв, и мы продолжим ориентироваться на продукцию и тенденции мирового рынка. Несомненно, прежними темпами продолжится наращивание объема данных, которые все больше и больше приобретают неструктурированную природу. Особое внимание будет уделяться скрываемым под термином «Big Data» разрозненным данным и технологиям их дальнейшей обработки и анализа, где ожидается использование специализированных высокопроизводительных устройств краткосрочного хранения. Значительное увеличение емкости прочно занявших свою нишу твердотельных дисков SSD и постепенная замена ими стандартных HDD дополнятся дальнейшим развитием массивов архитектуры All-Flash, где скорости обработки еще выше. Растущие объемы «холодных» данных дают почву задуматься о более широком использовании облачных сервисов хранения в частности и гибридной облачной модели в целом вместо наращивания собственной инфраструктуры. Это позволит избежать долгосрочных капитальных затрат и перевести их в операционные, что особенно актуально в текущей экономической ситуации. Растущие потребности в централизации управления, унификации хранения, автоматизации и гибкости предоставляемых сервисов выводят на первый план относительно новый подход программно-определяемых систем хранения данных (Software Defined Storage – SDS), сочетающий в себе как уже известные технологии, например виртуализацию хранения, так и современный подход разделения механизмов хранения и управления с абстрагированием от оборудования, а также развитие гиперконвергентных систем.

Современные тенденции подразумевают быстрый рост объемов хранимых данных, а также их разнообразие (неструктурированные данные), что требует различных подходов к хранению, обработке и защите. Кроме того, со временем требования могут меняться как из-за внутренних факторов (увеличения объемов, скорости, появления новых типов данных), так и из-за внешних факторов (требований регуляторов к срокам хранения). Простое наращивание емкости уже имеющихся систем не приводит к ожидаемому результату, требуется оптимизация инфраструктуры хранения данных.

Пути развития традиционных СХД

Выбор СХД всегда должен в полной мере соответствовать требованиям бизнеса, таким как объем и сроки хранения данных, их критичность для бизнеса и соответственно требованиям к безопасности и защите, причем все эти требования могут меняться исходя из жизненного цикла данных. Затраты на СХД должны быть пропорциональны ценности хранимых на них данных. Многие под словами «дешевая СХД» понимают стоимость 1 Гб хранимых данных, однако это неправильно. Необходимо оценивать стоимость хранения с учетом множества факторов, таких как операционные расходы на поддержку, вероятное время простоев, возможность и стоимость расширения в будущем, привязку к вендору и др.

Затраты на СХД в России составили 2,7% общих затрат на ИТ-оборудование, т. е. примерно 550 млн долл. (IDC CEE Black Book, 2014). Стоимость 1 ГБ неизменно снижается. С 2014 до 2018 г., по прогнозам IDC, она упадет в три раза, с 0,72 до 0,23 долл. за 1 ГБ. За это же время ежегодный прирост используемой емкости планируется на уровне 36% – с 49,5 до 179,2 ПБ (Worldwide and US Enterprise Storage Systems 2014–2018 Forecast, IDC, 2014). Однако оценивать СХД только по стоимости 1 Гб хранения некорректно, необходимо учитывать и стоимость операции ввода-вывода либо оперировать совокупной стоимостью. Классические жесткие диски хороши только своей емкостью, да и то лишь пока. Обеспечение требуемой производительности с помощью исключительно жестких дисков допустимо, но в итоге может стать экономически невыгодно в силу необходимости наличия большого их количества. И тут возникает понимание, что устоявшееся мнение о дороговизне флэш-памяти на самом деле не очевидно. Если существует реальная бизнес-потребность в высокой производительности ввода-вывода данных, то альтернативы просто нет, а стоимость хранения данных следует считать не только по статье расходов (начальным капитальным и последующим операционным затратам), но и по статье доходов, а именно по тем преимуществам, которые бизнес получает от новых технологий. Для многих компаний высокая производительность при работе с данными является гарантией увеличения прибыли и процветания бизнеса.

Около трети респондентов из числа крупных предприятий уже используют в своей инфраструктуре твердотельную память какого-либо вида в серверах или СХД, а еще 17% планируют использовать ее в ближайшее время. Основными бизнес-приложениями, для которых используется флэш-память, являются СУБД и OLTP (39%), планирование ресурсов на уровне предприятия (36%), аналитика и OLAP (27%) (Enterprise Strategy Group, 2014). По разным оценкам, средний размер производственной базы данных составляет 10 ТБ, что при важности такого рода данных делает экономически целесообразным полностью разместить их на флэш-памяти. Также стоит отметить использование флэш-памяти в сценариях VDI, где существуют значительные пиковые нагрузки.

Снижение стоимости твердотельной памяти ведет к трансформации рынка СХД и смещению парадигмы в сторону полностью флэш-массивов и многоуровневого хранения, что является важным способом снижения стоимости владения СХД. Практика показывает, что замена даже 10% стандартной дисковой емкости твердотельными носителями SSD с организацией двух уровней хранения может привести к многократному выигрышу в производительности. На текущий момент большинство продаваемых на рынке массивов являются гибридными и позволяют использовать в качестве носителей диски SSD, а также создавать с их помощью многоуровневое хранение. Однако SSD в формате обычного диска 2,5” выпускаются лишь для аппаратной совместимости с имеющимися СХД и не в полной мере раскрывают свои способности, упираясь в ограничения интерфейса SAS, который, впрочем, получил расширение до 12 Гбит/с (SAS-3). Массивы, изначально спроектированные полностью под флэш-память, используют другие интерфейсы, в частности, более производительный PCIe, и спроектированы на базе серверов стандартной архитектуры. Среди поставщиков такого рода решений стоит отметить EMC XtremIO, PureStorage Flash Array, Violin Memory, IBM Flash System, NetApp EF и др.

Объем поставленных носителей SSD на корпоративном рынке в 2014 г. превысил 3000 ПБ, прогноз на 2015 г. – 50 000 ПБ с последующим ростом 63% ежегодно (Worldwide Solid State Drive 2014–2018 Forecast and Analysis, IDC, 2014). Причем отмечена тенденция к увеличению поставок SSD с интерфейсом PCIe и уменьшению с интерфейсом SATA, что говорит о возрастающей потребности в скорости обмена. В пользу этого также говорит появившаяся в 2014 г. технология ULLtraDIMM SSDs от SanDisk – стандартные модули DIMM c интерфейсом DDR3 на 200 и 400 ГБ для особо требовательных к задержкам (менее 5 мкс на запись и 150 мкс на чтение) и производительности (44 K IOPS на запись и 144 K IOPS на чтение) нагрузкам.

Среди основных преимуществ использования гибридных многоуровневых СХД можно выделить оптимизацию стоимости хранения благодаря размещению данных на оптимальном уровне и автоматическое перемещение в зависимости от востребованности, консолидацию хранения путем размещения на многоуровневом массиве разнородных данных, снижение стоимости управления инфраструктурой за счет консолидации и автоматизации, соответствие уровням обслуживания (SLA).

Неоспоримые преимущества использования конвергентных систем и развитие сетевых технологий обеспечили возможность плотного объединения сетей передачи данных с сетями хранения данных. Единая конвергентная сеть позволяет снизить капитальные и операционные издержки за счет уменьшения количества адаптеров, сетевого оборудования и коммутации. Снижение стоимости сети 10GE и стандартизация Ethernet 40/100GE вкупе с протоколами, позволяющими гарантировать отсутствие потери пакетов, обусловили изменение подхода к построению сети ЦОД – от классической трехуровневой архитектуры в сторону плоской конвергентной, объединяющей LAN и SAN, позволяющей упростить инфраструктуру и получить преимущества агрегации каналов. И пусть на текущий момент доля внедренных систем с «чистым» Fibre Channel самая большая (не считая DAS) и превышает 7500 ПБ (ежегодный прирост 37%), ежегодный прирост систем на базе протокола FCoE находится на уровне 121%, что говорит о его перспективности и востребованности (Worldwide Storage and Virtualized x86 Environments 2014–2018 Forecast, IDC, 2014).

Тем предприятиям, где не требуется отчуждение резервных копий для долгосрочного хранения на удаленных площадках, стоит присмотреться к системе резервного копирования с использованием дисковых массивов или VTL, так как стоимость хранения выравнивается, а приобретаемые преимущества позволяют чаще делать контрольные точки и быстрее восстанавливать данные в случае их повреждения.

Виртуализация и программно-определяемые СХД

Трансформация индустрии СХД продолжается, и основными трендами ближайшего времени будут дальнейшее проникновение облачных решений и интеграция локального хранения с облачным. Самым простым сценарием может стать размещение резервных копий данных в облаке поставщика услуг. Продвинутый сценарий подразумевает репликацию данных в облако и переключение в случае аварии на арендуемые мощности. Поддержка интерфейса REST API позволяет интегрироваться с поставщиками услуг хранения, например с Amazon S3, OpenStack Swift, EMC Atmos и др.

Несколько слов об уже не молодой технологии виртуализации СХД, которая сейчас особенно востребована. Виртуализация СХД дает такие преимущества, как высвобождение (за счет перераспределения) емкости и отсрочка приобретения новых ресурсов, создание уровней хранения, продление срока службы унаследованных систем, экономия затрат на миграцию и репликацию данных, приобретение лицензий, создание единой точки доступа и упрощение управления всеми ресурсами хранения, сокращение времени простоев. Можно выделить два основных подхода к виртуализации СХД: исторический вариант, не потерявший актуальности и сейчас в виде готового программно-аппаратного комплекса, выступающего как самостоятельная система хранения и позволяющего подключать к себе унаследованные массивы (например, IBM SVC, NetApp V-Series, EMC VPLEX, HDS Storage VM и др.), и в виде ПО виртуализации (или апплаинса без собственного пула ресурсов), размещаемого на стандартном сервере и управляющего различными ресурсами хранения (например, EMC ScaleIO, VMware vSAN). Особо стоит отметить решения по виртуализации локальных ресурсов вычислительных систем. Например, VMware vSAN позволяет объединить локальные диски хостов виртуализации в единую отказоустойчивую СХД и размещать на ней виртуальные машины в соответствии с требованиями по производительности и отказоустойчивости.

Все больший вес в нашей жизни приобретают новые форматы взаимодействия и обмена данными – облачные службы, социальные сервисы, мобильные устройства, большие данные, что привносит изменения в классическую ИТ-инфраструктуру, предъявляя повышенные требования к хранению и скорости обработки данных, безопасности, масштабируемости, а также к снижению стоимости владения. Пришло время фундаментально изменить классическую архитектуру хранения данных, абстрагируя сервисы хранения от аппаратного обеспечения, как это произошло с серверной виртуализацией. Это позволит иметь полнофункциональную унифицированную систему хранения, управляемую программно, с возможностью автоматического распределения ресурсов в соответствии с требованиями приложений, использующую в качестве места непосредственного хранения и технологически новые устройства, и унаследованные СХД, а также разнообразное дешевое оборудование. При этом осуществляется переход от жесткой архитектуры, заданной производителями аппаратных СХД, к программируемой, обеспечивающей высокую гибкость и эффективность за счет богатого, реализованного с помощью ПО функционала (дедупликация, сжатие, шифрование, мгновенные снимки, динамическое выделение ресурсов и др.) и транслируемого на все подключенные устройства хранения, даже если они этим функционалом ранее не обладали.

Что касается собственно SDS, то, по определению Worldwide Software-Defined Storage Taxonomy (IDC, 2014), – это платформа, обеспечивающая полный спектр сервисов хранения с помощью ПО и использующая в качестве физических устройств хранения любое доступное оборудование. Согласно опросу IDC (European Storage Survey, 2014), более 35% респондентов тестируют решения из области SDS, а свыше 15% уже инвестировали в них, около 30% заинтересованы, но не имеют конкретных планов по реализации. Среди основных приоритетов опрашиваемые отметили уверенность в сохранности данных (38%), снижение стоимости хранения (37%), расширение емкости хранения (36%).

К специфике SDS, как известно, можно отнести: способность работать с любым оборудованием, включая самое доступное; поддержку всех возможных типов СХД как по архитектуре, так и по интерфейсу, в том числе возможность интеграции с носителями на лентах и облачными средами хранения, предоставления встроенного функционала любым подключенным ресурсам; обеспечение централизованного управления всеми ресурсами хранения; выделение ресурсов на основе политик и требований приложений; автоматическое перемещение данных между уровнями хранения в зависимости от потребностей и стоимости хранения; независимость от сред виртуализации; предоставление интерфейсов API для расширения функционала и поддержки сторонних систем; обеспечение доступа к ресурсам хранения по принципу самообслуживания; высокую масштабируемость; динамическую адаптацию к новым нагрузкам и сценариям использования.

Логично предположить, что SDS является наследником виртуализации СХД, но не дублирует ее. Виртуализация подразумевает абстрагирование ресурсов хранения и создание на их базе пулов, тогда как программно-определяемые системы отделяют функции и сервисы от физических ресурсов хранения. Среди игроков рынка SDS стоит выделить компании, изначально ориентированные на разработку ПО для SDS (например, Nexenta, DataCore, Atlantis), поставщиков классических СХД, предлагающих решения для SDS (EMC ViPR, IBM Spectrum Scale, NetApp DATA ONTAP, HP StorVirtual), поставщиков программно-аппаратных комплексов гиперконвергентных систем (Tintri, Nutanix, Nimble, Solidfire и др.).

Программно-определяемые СХД являются частью концепции программно-определяемого ЦОД (Software-Defined Data Сenter, SDDC). Глобальный рынок SDDC в 2013 г. составил 396,1 млн долл. и, по прогнозам, вырастет до показателя 5,4 млрд долл. к 2018 г., показывая ежегодный прирост 68% (SDS Industry Report, IMEX Research, 2014).

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку