Долгоиграющие ЦОД, или Принципы сохранения инвестиций в серверное оборудование

Чиндяскин Дмитрий Владимирович, руководитель Технической дирекции, ГК «Ай-Теко»

Центр обработки данных (ЦОД или дата-центр) является сегодня одним из важнейших активов в коммерческих и государственных компаниях. Зависимость жизнедеятельности организаций от информационных технологий возрастает. В сочетании с беспрецедентным увеличением объемов данных это привело к необходимости пересмотра принципов и подходов к построению традиционных ЦОД.

 

Общие принципы

Архитектура типового ЦОД должна соответствовать принципам сервисно-ориентированной архитектуры (SOA) – актуальной методики динамической адаптации ресурсов ЦОД к изменяющимся требованиям тех бизнес-процессов, которые этими ресурсами поддерживаются.

Сервисно-ориентированная архитектура (SOA) позволяет создавать гибкие платформы, которые в состоянии быстро развернуть требуемый ИТ-сервис или набор сервисов для обеспечения поддержки новых бизнес-процессов, ускоренной разработки продуктов и услуг. Динамический адаптивный центр обработки данных в компании является важнейшей составляющей внутренней архитектуры бизнеса, ориентированной на сервисы.

Применение SOA в целом, на уровне приложений, требует создания SOI – сервисно-ориентированной инфраструктуры – сетей, серверов и сервисно-ориентированных систем хранения данных. SOI должна быть способна гибко и адекватно реагировать на изменения требований бизнес-сервисов.

Ключевыми понятиями современного подхода к построению ЦОД являются консолидация и виртуализация, позволяющие достичь высокого уровня гибкости, масштабируемости и эффективности работы всех систем.

 

Архитектура современного ЦОД

В настоящее время информационные технологии (ИТ) в целом и информационные системы (ИС), базирующиеся на них, становятся более мощными, стандартизированными и доступными, с одной стороны, оставаясь крупной и регулярной статьей расходов компании – с другой. Этот факт не может не учитывать бизнес, который вынужден анализировать объем и структуру расходов на ИТ, пересматривать принципы приобретения ИТ-активов и управления ими. Чтобы повысить эффективность применения информационных технологий, необходимо снизить TCO, повысить утилизацию оборудования, гибкость и адаптивность инфраструктуры.

Эволюция ИС, повышение значимости информационных технологий в бизнес-процессах показывают, что ключевым становится критерий эффективности. Именно с позиций эффективности для бизнес-процессов и нужно рассматривать архитектуру, принципы построения, процессы масштабирования и модернизации современных дата-центров.

Сегодня типовая архитектура ЦОД предполагает наличие таких компонентов, как:

  • вычислительная инфраструктура (ВИ);
  • сетевая инфраструктура (СИ);
  • системы и сети хранения данных (СХД);
  • инженерная инфраструктура (ИИ);
  • система мониторинга;
  • система резервного копирования и восстановления данных;
  • система обеспечения ИБ.

 

Принципы масштабирования подсистем ЦОД

Вычислительная архитектура актуального дата-центра содержит такие типовые компоненты, как стоечные серверы общего назначения, серверы, ориентированные на сегмент HPC, модульные серверы, серверы высокой готовности с повышенными RAS-параметрами, размещенные в ЦОД и создающие необходимый пул ресурсов для развертывания приложений.

Однако только консолидации недостаточно. Традиционный подход к развертыванию ИС, за редким исключением, не применяется, и ключевым подходом становится серверная виртуализация.

Хосты виртуализации в сочетании с системами хранения образуют пулы вычислительных ресурсов, доступных по требованию и обеспечивающих при незначительном резервировании и прямую, и обратную масштабируемость, а также высокую доступность данных. Вертикальная масштабируемость подобных пулов реализуется добавлением как новых CPU и модулей памяти, так и новых хостов в кластер виртуализации, что возможно обеспечить динамически, без остановки сервисов.

Требования большей гибкости в масштабировании консолидированных ресурсов привели к переходу от конвергентных решений к гиперконвергентной архитектуре (HCI), реализующей гибкую компонентную инфраструктуру, где в единую виртуальную систему объединены все вычислительные ресурсы, системы хранения данных и сетевые каналы. Появление HCI-решений определило парадигму SDS – программно-определяемого хранилища и программно-определяемого дата-центра (SDDC).

HCI-решения от VMware (vSAN), Nutanix, HPE (SimpliVity) реализуют модель масштабирования типа «без ограничений» (scale out).

Необходимость при масштабировании добавлять новый узел определенной конфигурации в кластер HCI ограничивает гибкость решения. И в ближайшей перспективе на смену гиперконвергентной инфраструктуре, возможно, придет компонентно-дезагрегированная инфраструктура (Composable-Disaggregated Infrastructures – СDI), которая позволит преодолеть выявленные ограничения HCI и управлять выделением ресурсов в режиме реального времени.

Из-за масштабирования и повышения требований со стороны приложений увеличиваются требования к сетевой инфраструктуре – пропускной способности, надежности и защите сети, управляемости. Необходимо учитывать эти положения на ранних этапах формирования проектных решений по СИ, ориентируясь на модульную архитектуру, возможность организации стеков из коммутаторов, современные технологии построения сетей – SDN, spine-leaf и др.

Очевидным образом масштабирование вычислительных ресурсов и системы хранения требует адекватной модернизации компонентов ИИ, имеющих существенно больший срок эксплуатации. И если правильно спроектированных систем типа СКС это коснется незначительно, то системы управления климатом и СБЭ в высокой степени привязаны к существующей конфигурации КТС. Особенно важным этот аспект ИИ становится с учетом того, что десять лет назад затраты на электроэнергию и охлаждение оборудования превышали 50% всех издержек на содержание ЦОД, а сегодня могут составлять до 70%.

Поэтому на этапе проектирования решений по ИИ следует заложить основы будущего масштабирования и создания резервных подсистем. Проектируемые системы ИИ ЦОД должны быть готовы гибко адаптироваться к изменяющимся требованиям бизнеса, что может быть реализовано благодаря применению стандартизированных и модульных решений.

При проработке решений по СБЭ необходимо руководствоваться принципом модульности и возможностью апгрейда систем, предлагаемых вендором. Например, Schneider Electric предлагает услугу MPRS – комплексной модернизации ИБП, которая продлевает срок эксплуатации на пять и более лет, позволяя сэкономить 35–40% по сравнению с покупкой нового источника. Процесс модернизации проходит практически без остановки сервисов.

 

Модернизация КТС ЦОД

Жизненный цикл комплекса технических средств (КТС) ЦОД, за исключением ИИ, составляет в России пять-семь и более лет (зарубежные практики оперируют полным апгрейдом КТС на горизонте трех-пяти лет). Каковы варианты эффективной модернизации?

Апгрейд – наиболее простой способ решения проблемы модернизации, не требующий больших вложений.

Вместо закупки нового оборудования можно увеличить объем памяти серверов и в некоторых случаях заменить процессоры более производительными из совместимой линейки. Переход на новое оборудование, на новую программную платформу, организация закупки, обучение персонала – более затратный путь.

В части СХД ведущие вендоры (Hitachi Vantara, HPE) поддерживают апгрейд своих систем не только горизонтально, но и с переходом на старшие модели контроллеров без изменения функциональной составляющей.

Однако все сказанное справедливо при планировании на три-пять лет, пока оборудование не вышло в стадию EOL, комплектующие и запчасти доступны и стоят недорого. Еще один минус заключается в том, что оборудование может стареть морально, не отвечая новым релизам ПО в части совместимости и т. п.

Еще один метод модернизировать ЦОД – полная замена КТС. Его, как правило, практикуют зарубежные компании. По сравнению с апгрейдом этот метод является более затратным. Среди очевидных преимуществ – новые производительные и энергоэффективные платформы, высокая производительность, новый софт и функциональность, поддержка вендоров на пять-десять лет и т. п. Компенсировать издержки от высокой стоимости закупок (CapEx) помогут специальные схемы финансирования – лизинг, GL Flex Capacity от HPE и др.

Следующий метод модернизации ЦОД – частичная замена. Это комбинированный вариант, нечто среднее между апгрейдом и полной модернизацией КТС. Путем проведения анализа и приоритезации задач можно выделить приложения, наиболее критичные для бизнеса, и именно их мигрировать на обновляемые платформы.

Не столь критичные ИС продолжат функционировать на старом оборудовании. Необходимо иметь в виду, что с увеличением срока эксплуатации поток отказов старого оборудования будет возрастать, поэтому вместо утилизации высвободившегося КТС стоит направить его для целей повышения отказоустойчивости, поддержки как в «горячем», так и «холодном» резерве.

 

Старение оборудования

Модернизация в широком смысле должна учитывать и такой аспект, как преждевременное старение оборудования. Именно консолидация и виртуализация вычислительных сред, выступающие «волшебным ключиком» для решения текущих проблем ЦОД, приводят к преждевременному старению компонентов ИТ-инфраструктуры.

Одним из первых претендентов на ускоренное старение, причем не моральное, а физическое, становится CPU. Технологии уровня облачных нацелены на возможное повышение утилизации серверов, не приводящее к деградации производительности виртуализированных приложений, что означает максимизацию нагрузки с применением балансировки по всему кластеру приложений или всему дата-центру.

Таким образом, генеральная цель повышения утилизации серверов порождает косвенные проблемы. По мере увеличения утилизации процессорные модули начинают работать практически постоянно. Блоки внутри CPU разогреваются больше и чаще, что приводит к преждевременному старению, а также к тому, что CPU начинают пропускать такты обработки, встроенные процессоры порождают джиттер и т. д.

Внедрение серверной виртуализации с максимальной «переподпиской» эффективно с точки зрения использования энергии и других эксплуатационных расходов, но серьезно влияет на деградацию и старение электронных схем в целом. Поэтому ключевым становится вопрос корректного и обоснованного проектирования подсистем ЦОД.

Основные тенденции СХД в контексте старения сводятся к изменению парадигмы хранения, в том числе переходу от HDD и гибридных решений к All-Flash-системам, которые становятся даже эффективными по стоимости. Вопрос актуален, но для его решения пока недостаточно статистических данных.

Какова степень деградации модулей SSD, даже при снижающейся стоимости их приобретения, пока непонятно. Заявленные характеристики HDD-массивов ведущих производителей известны и очень высоки. Вопрос остается, таким образом, открытым.

Однозначно проблема старения классических СХД решается традиционным способом. Корректно выбранные при проектировании СХД позволяют менять «стареющие» HDD произвольно и смешанно, продлевая жизнь системе в целом и с учетом возможного вертикального апгрейда.

Наименьшему старению подвержены правильно спроектированные и развернутые системы инженерной инфраструктуры, кроме уже отмеченных нюансов организации СБЭ.

Заключение

В любом случае фокус владельца ресурса должен быть направлен на тщательное проектирование ИИ с учетом трендов масштабирования и специфики DRS, что в лучших практиках дает хороший многолетний эффект. Лучшие практики основных вендоров позволяют создать контур ИИ с гарантированным сроком эксплуатации 15–25 лет.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку