Гиперконвергентность в решениях мировых вендоров: тренды, примеры новинок, преимущества применения

В последние несколько лет все прочнее укореняется мнение, что инфраструктура в отличие от данных и аналитики все меньше и меньше интересует управленцев. И правда, что там может быть интересного? Многие решения давно стали типовыми, перешли в разряд commodity и, казалось бы, что-то новое придумать уже сложно. Между тем для компаний, идущих по пути цифровой трансформации, такое заблуждение может стоить очень дорого – и не только в финансовом плане, но и с точки зрения времени выхода на рынок и упущенного спроса. Сегодня мы будем говорить о гиперконвергентных решениях для платформы виртуализации, технологии, которая при грамотном использовании может помочь значительно снизить совокупную стоимость владения ИТ-платформой, повысить ее надежность и сократить время внедрения новых сервисов. Все это разом – как такое возможно? Давайте разбираться.

История возникновения гиперконвергентного подхода сама по себе достаточно интересна. Все началось около 10 лет назад, когда многие компании стали всерьез задумываться о внедрении инфраструктуры виртуальных рабочих мест (VDI). Реализация такой инфраструктуры на традиционных конвергентных архитектурах с дисковым массивом (СХД), сетью SAN и фермой блейд-серверов имела одно узкое место: при одновременном массовом включении тысяч (или даже сотен) рабочих мест в начале рабочего дня возникал эффект экстремально пиковой нагрузки на подсистему ввода-вывода (этот эффект получил название boot storm). Предпринимались различные попытки решения этой проблемы. Одно из решений заключалось в установке в каждом сервере SSD-накопителя с «золотым» образом виртуальных машин. Идея была в том, чтобы данные, обращение к которым велось наиболее часто, распределить по локальным дискам всех серверов системы. Это сильно снижало нагрузку на СХД, на которой теперь хранились только пользовательские профили. Со временем это привело к идее отказаться от СХД полностью. Это было возможно при использовании распределенных файловых систем, например, таких как GFS или Ceph. Почти одновременно возникли десятки стартапов, предлагавших законченную платформу под VDI на базе серверов стандартной архитектуры и собственного ПО, что получило название «программно-определяемая система хранения» (SDS – Software Defined Storage). А весь подход в целом стал называться гиперконвергенцией. Приставка «гипер» здесь означает реализацию многих аппаратных функций традиционных СХД за счет программных решений, работающих внутри серверов. Жесткая конкуренция между этими стартапами за несколько лет привела к появлению по-настоящему интересных решений, таких как, например, файловые системы, использующие для хранения данных объектные хранилища. Такие системы, с одной стороны, обладают высокой производительностью, а с другой – допускают практически неограниченное масштабирование. В итоге часть этих стартапов была куплена более крупными игроками на рынке ИТ-инфраструктур, другая часть до сих пор существует самостоятельно, но все они вместе сформировали новый быстрорастущий рынок с огромным потенциалом не только в сфере VDI-решений, но и в целом инфраструктур для виртуализированных приложений.

Глядя на такой длинный путь, который прошли в своем развитии гиперконвергентные системы, возникает резонный вопрос: чем же они так хороши? Давайте разберемся с этим поподробнее. Если попробовать охватить весь спектр преимуществ какой-то одной характеристикой, то это будет простота, простота во всем – архитектуре платформы, управлении, процедурах обслуживания, интеграции с внешними сервисами и т. д. И уже эта простота определяет те отдельные преимущества для бизнеса, которые можно измерить и использовать для принятия решения в пользу применения гиперконвергентных систем в том или ином случае. Рассмотрим эти преимущества с трех разных точек зрения: технической, функциональной и экономической. Тут необходимо сразу оговориться, что любые сравнения имеют смысл только в том случае, если мы сравниваем гиперконвергентную систему целиком с другой аналогичной платформой виртуализации, не важно, построенной по конвергентному или гиперконвергентному принципу. С технической точки зрения основное преимущество гиперконвергентной платформы – это меньшее количество разнородного аппаратного обеспечения. В классической системе серверы, SAN-сеть и дисковый массив представляют собой отдельные устройства с отдельными интерфейсами управления и своими принципами настройки. Во-первых, необходимо уметь их конфигурировать, интегрировать между собой, чтобы итоговая система работала так, как требуется. Любое изменение, затрагивающее более одного уровня, требует проверки и валидации, иначе есть риск все поломать. Во-вторых, каждое отдельное устройство может также быть точкой отказа, а значит, номенклатура запчастей, которые заказчики или производители должны хранить на случай поломки, существенно увеличивается. В противоположность этому гиперконвергентные системы с аппаратной точки зрения состоят из стандартных серверов, поверх которых работает специализированное ПО, и сетевых коммутаторов. Поэтому настройка и обслуживание таких систем значительно проще, а количество запасных частей существенно меньше. С функциональной точки зрения те функции, которые ранее были реализованы посредством контроллеров дисковых массивов, сегодня выполнены на уровне программного обеспечения, и это дает огромные преимущества. Первое, что видит администратор любой гиперконвергентной платформы: все операции, которые ранее были разбросаны по разным интерфейсам и консолям, в HCI-системе собраны в одном месте. Создать дисковую группу и презентовать ее только что созданной виртуальной машине сегодня можно в одном и том же окошке vCenter (или System Center). Это не только сильно экономит время администратора, но еще и позволяет избегать значительного числа ошибок, поскольку многие рутинные операции в HCI-системах автоматизированы и не требуют активного контроля со стороны человека. Более существенным функциональным отличием является то, что многие продвинутые функции дисковой подсистемы, такие как дедупликация, компрессия, возможность аппаратных мгновенных снимков (странно использовать этот термин применительно к программно-определяемым СХД, но имеются ввиду снимки, выполненные средствами самой программной СХД, а не средствами платформы виртуализации), входят в стандартный комплект поставки и не требуют для своего использования отдельного лицензирования (и оплаты). И третьим существенным преимуществом в функциональном плане является возможность апгрейда системы за счет простого обновления ПО. В частности, в платформе Cisco Hyperflex очень многие функции, включая возможность построения геораспределенных кластеров с синхронной репликацией, были добавлены простым переходом на более высокую версию ПО. Все перечисленные преимущества находят свое отражение и в экономике владения ИТ-платформой. Меньшее количество «железа», а точнее – различных типов оборудования, почти автоматически приводит к 10–15% экономии капитальных затрат на старте проекта по сравнению с классическими конвергентными решениями. А покупка системы целиком у одного поставщика (там, где это возможно) экономит еще и время внедрения, которое для наиболее продвинутых систем может занимать не более чем 1–2 дня, включая физическую сборку и интеграцию с существующей инфраструктурой компании. Еще более существенной экономии удается достичь на этапе эксплуатации. За счет интеграции многих функций в едином интерфейсе и автоматизации рутинных операций общие затраты на администрирование по опыту заказчиков таких систем сокращаются на 50–70%, а значит, снижается и совокупная стоимость владения системой (TCO). Отдельно стоит сказать про техническую поддержку – при эксплуатации любой системы неизбежно возникает необходимость к ней обратиться. И если поставщик HCI-системы осуществляет поддержку в режиме «единого окна» – это также существенно влияет на снижение TCO. С точки зрения расширения ресурсов гиперконвергентные системы позволяют достигать большей «плавности» расходования средств по сравнению с традиционными конвергентными системами. Вы можете начать эксплуатировать систему с 3–4-х серверов и постепенно, хоть по одному серверу, вырастить ее до нескольких десятков. Это правило действует не для всех HCI-систем, у некоторых есть ограничения. И если для компании важна экономика проекта, то на него нужно обратить отдельное внимание на этапе выбора платформы. Также важным моментом является то, что гиперконвергентные системы дают большую степень защиты инвестиций в ИТ-платформу. Как известно, каждые 2 года происходит полная смена поколения серверных платформ. Смена поколений дисковых массивов также происходит, хоть и медленнее. В традиционных конвергентных платформах однажды настает момент, когда компании необходимо вложить деньги в полную замену оборудования, так как частичный апгрейд становится невозможен. Производители гиперконвергентных платформ позволяют использовать в одном кластере серверы разных поколений, что дает возможность вкладываться в развитие постепенно. Все эти преимущества приводят к тому, что компании начинают активнее применять HCI-решения для построения ИТ-ландшафтов. На сегодняшний день эти системы хорошо зарекомендовали себя в качестве платформы для самых разнообразных систем. Помимо VDI-инфраструктуры, из которой эти решения выросли, сегодня многие заказчики используют их для так называемой общей платформы виртуализации (general virtualization), а также для других более специфичных задач.

И здесь самое время остановиться не только на преимуществах этих систем, но и на их сегодняшних недостатках. Основное, о чем говорят критики гиперконвергентных платформ, – это невозможность их использования для размещения больших высоконагруженных баз данных с транзакционной нагрузкой. Архитектура хранения с прямым подключением большого числа дисков напрямую в серверы и программным управлением СХД при доступных 2–3 года назад скоростях работы дисковых накопителей действительно не позволяла достичь высокой производительности на одном потоке ввода-вывода. При этом для большого числа не очень высоких нагрузок такая система работает значительно быстрее, чем традиционные СХД. Тут стоит особо определиться, что значит «большая база данных». Дело в том, что производительность – это одна из характеристик, по которой существующие сегодня на рынке системы могут отличаться в разы. Многочисленные тестирования, проведенные заказчиками платформы Cisco Hyperflex, показали, что базы данных менее 2 ТБ могут работать на этой системе даже при использовании для хранения данных обычных вращающихся дисков (HDD). Для большей производительности уже необходимо использовать SSD- или NVMe-диски (All flash-, All NVMe-системы). Другие производители требуют SSD-диски даже для гораздо менее объемной нагрузки. Также у некоторых поставщиков чисто программных решений SDS есть практика создания выделенной сети для передачи только служебного трафика программной СХД. Такой подход несколько увеличивает производительность системы, но добавляет приличные накладные расходы на администрирование, а также увеличивает стоимость проекта.

Альтернативным вариантом может являться размещение требовательной СУБД на выделенном разделе внешнего дискового массива. Такой подход возможен, только если производитель гиперконвергентной платформы позволяет использовать одновременно конвергентный и гиперконвергентный подходы. И если это так, пользователи подобной системы получают беспрецедентную гибкость, недоступную другим решениям.

Настала пора кратко рассказать, какие же HCI-решения на сегодняшний день доступны заказчикам. Для более полного обзора рекомендуется обратиться к «магическому квадранту» Gartner по рынку гиперковергенции, самая свежая доступная версия которого вышла в январе 2019 г. В нем рассмотрено 14 вендоров, из которых мы остановимся на четырех, отмеченных Gartner как лидеры в сегменте HCI. Это такие продукты, как Acropolis OS от Nutanix, vSAN от Vmware, Simplivity от HPE и Hyperflex от Cisco. Первые два продукта представляют собой целиком программные решения, по замыслу их производителей устанавливаемые практически на любые серверы, конфигурация которых соответствует требованиям. Основная идея таких решений – обеспечение возможности использования свободных вычислительных ресурсов для построения среды виртуализации с отказоустойчивым хранением данных. Этот подход в действительности позволяет многим компаниям экономить на построении инфраструктур в первую очередь для сред разработки и тестирования приложений, т. е. для тех случаев, когда высокая производительность и надежность не являются основным приоритетом. В некоторых случаях их также можно использовать и для размещения продуктивных приложений, до тех пор пока их требования к производительности невелики. Решения от HPE и Cisco представляют собой законченные аппаратно-программные комплексы, включающие не только ПО, но и серверы, а в случае Hyperflex – еще и сеть. Такой подход ориентирован в первую очередь на корпоративных заказчиков, которым важны производительность, надежность и техническая поддержка используемых решений. Поставляя законченный программно-аппаратный комплекс, производитель может еще на этапе разработки подумать о том, как его компоненты будут работать друг с другом наиболее оптимальным образом, а также предоставить комплексную техническую поддержку на все решение целиком. Да, на базе Nutanix и vSAN также существуют готовые АПК на серверах Dell, Lenovo и других производителей, но это скорее интеграционное решение от одного из вендоров, сами же компоненты такого решения разрабатываются по отдельности и никак не подгоняются друг под друга. Конечно же, такое разнообразие продуктов, а если посмотреть за пределы сегмента лидеров – оно будет еще больше, не может не вызывать растерянности: какое решение выбрать, на какие аспекты обращать внимание в первую очередь? И здесь очень важно ориентироваться на существующие истории успеха и на то, насколько открыто вендор предоставляет информацию о производительности и результатах тестирования решения. При этом важно, что за тесты нам показывают. Например, ряд вендоров очень любит показывать высокую пиковую производительность единичной виртуальной машины, но такой тест сильно оторван от реальной жизни. Он ничего не говорит о том, как платформа с несколькими десятками или сотнями виртуальных машин будет вести себя при долговременной нагрузке. В настоящий момент только Cisco открыто публикует тесты производительности своих систем под нагрузкой, приближенной к реальной нагрузке в инфраструктуре заказчиков.

С этой точки зрения интересно проанализировать, кто и для чего сегодня использует гиперконвергентные системы. Как уже упоминалось, первое и основное применение HCI – это платформы VDI. И наверное, более половины инсталляций таких систем до 2017 г. составляли виртуальные рабочие места. Многие производители, например Simplivity открыто заявляют о том, что рынок VDI-решений для них является целевым. Ситуация стала меняться после выхода в 2016 г. на рынок HCI компании Cisco с продуктом Hyperflex. Оптимизированная на всех уровнях архитектура этого решения позволила использовать HCI для общего случая виртуализации в тех ситуациях, когда речь идет о десятках виртуальных машин с относительно небольшими дисками (менее 1–2 ТБ). Позже, в 2017-м, когда стоимость SSD-дисков снизилась настолько, что их стало возможным использовать достаточно широко, для задач общей виртуализации стали использовать также решения на базе Vmware vSAN и Nutanix. Сегодня уже есть примеры использования гиперконвергентных платформ на базе SSD- и NVMe-дисков даже для размещения относительно «тяжелых» нагрузок, таких как SAP HANA, серверы Oracle и т. д. Конечно, не все системы способны на такое, поэтому всегда желательно проводить предварительное тестирование, перед тем как принимать решение о внедрении той или иной системы. Еще одним перспективным направлением для гиперконвергентных систем являются платформы контейнерной виртуализации. Сегодня многие компании используют Docker для разработки, но как только возникает задача передать разработанные таким образом приложения в промышленную эксплуатацию, возникает проблема с обеспечением для таких систем подходящей надежной и отказоустойчивой инфраструктуры. И здесь в полной мере проявляются сильные места HCI: построение прикладной системы из множества единичных контейнеров позволяет хорошо распределить нагрузку, а отказоустойчивая подсистема ввода-вывода снимает необходимость заниматься обеспечением отказоустойчивости на уровне Docker. Дополнительно есть возможность получить техническую поддержку на всю платформу целиком, если все эти компоненты приобретаются у одного производителя.

Все сказанное выше привело к тому, что сегодня гиперконвергентные системы рассматриваются все большим количеством компаний. Среди тех, кто активнее всего внедряет эти решения, промышленные компании, ритейл и банки. Промышленность и ритейл привлекает простота внедрения и обслуживания HCI-систем, ведь, как правило, в этом сегменте ресурсы администраторов очень сильно ограничены – задач много, а людей мало. С этой точки зрения гиперконвергенция представляет замечательную возможность для снижения операционных затрат: по данным некоторых клиентов Cisco Hyperflex, после внедрения этих систем затраты на администрирование платформы виртуализации снижаются на 50–70%. Банки стали активно интересоваться гиперконвергенцией, после того как с широким распространением SSD-дисков выросла их производительность и снизилась стоимость. Один из наших заказчиков в банковской сфере использует Hyperflex для системы обработки первичных документов перед загрузкой их в базу данных. При полезном пространстве для хранения данных около 20 ТБ средняя скорость поступления новых данных в течение операционного дня составляет около 300 МБ/сек. Нетрудно подсчитать, что при такой нагрузке полезное пространство должно закончиться менее чем за 3 дня. Но на той же системе находятся обработчики, которые после сохранения полезной информации в СУБД стирают исходные данные. На сегодняшний день система работает в таком режиме более 9 месяцев без единого сбоя, что говорит о надежности гиперконвергентных платформ. Немаловажным фактом является то, что аналогичная система, построенная по традиционной конвергентной архитектуре, стоит в 1,5 раза дороже именно из-за требований по скорости ввода-вывода СХД. Кроме описанных выше трех категорий заказчиков HCI-платформы также используют множество компаний из других сегментов, но пока здесь нет каких-то ярко выраженных тенденций. Если брать международный опыт, то сложно найти сегмент экономики, где сегодня не были бы использованы эти решения.

Конечно, глядя вокруг и читая об успехах использования гиперконвергентных систем в других странах, может возникнуть ощущение, что рынок России отстает от международных тенденций. В действительности наибольшее распространение эти системы получили в США. Там в порядке вещей, например, проекты на 300–400 гиперконвергентных узлов, заказчиком которых является сеть больниц или крупный порт, ИТ-системы которого целиком переведены на гиперконвергентную платформу. Если же говорить о Европе, то и там в целом многие компании пока относятся к этим системам настороженно, хотя отдельные проекты и довольно крупные идут уже в течение трех лет. Например, Ericsson внедрила Hyperflex в нескольких десятках своих европейских ЦОД. На фоне Европы мы смотримся не так уж плохо. По неофициальной статистике Россия вместе с СНГ занимает третье место после Великобритании и Германии по распространенности HCI-платформ.

В целом хотелось бы подытожить наш сегодняшний обзор следующим образом. Очевидно, что поиск возможных применений гиперконвергентных инфраструктур сегодня находится в самом начале, несмотря на десятки успешно реализованных проектов в России и тысячи – в мире. Гиперконвергентный подход позволяет сильно упростить ИТ-системы, взглянуть по-другому на процесс построения инфраструктуры, и очевидно, что этот процесс дальше будет продолжаться. Сегодня можно выделить несколько векторов развития таких решений на ближайшее будущее. Во-первых, это дальнейшее повышение производительности систем, сегодня некоторые заказчики уже тестируют новые системы с NVMe-дисками на возможность работы с инфраструктурой «1С» и другими ERP-системами. Во-вторых, это возможность построения распределенных инфраструктур с миграцией виртуальных машин между ними по требованию. Гиперконвергентная инфраструктура позволяет производить миграцию приложений между различными кластерами значительно быстрее и проще, чем это происходит в традиционных конвергентных решениях. Для многих HCI-систем такая миграция – стандартный функционал, не требующий даже дополнительного лицензирования. Третье направление развития – снижение минимальной конфигурации HCI-кластера. В идеале у нас должна быть возможность запустить приложение для работы с данными в любой точке, где эти данные собираются и накапливаются в более-менее существенном объеме. И в этом направлении сегодня идет большая работа.

 

 

Поделиться:
Спецпроект

Напряженный трафик или Современные требования к инфраструктуре ЦОД

Подробнее
Спецпроект

Специальный проект "Групповой спутниковый канал для территориально-распределенной сети связи"

Подробнее

Подпишитесь
на нашу рассылку