Сетевые решения для вычислительных кластеров

 

Андрей Загребельный, ведущий инженер отдела сетевой инфраструктуры ЦОД, АМТ-ГРУП

По мере развития информатизации, использования цифровой информации и данных как неиссякаемых производственных ресурсов все более очевидна необходимость в высокопроизводительной информационной инфраструктуре. Этот инструмент должен за минимальное количество времени с максимальным уровнем доступности вне зависимости от его местоположения одновременно предоставить результат обработки колоссальных объемов информации большому количеству потребителей. Но насколько имеющиеся и разрабатываемые инструменты в виде информационной инфраструктуры в общем и сетевой инфраструктуры в частности соответствуют текущим и будущим вызовам по извлечению ценного ресурса?

 

Для поиска ответа вопрос нужно понимать текущие и новые требования и нелишним будет вернуться к истокам для оценки правильности выбранного пути развития с учетом опыта. Ведь процессы эволюции цикличны, развитие идет по спирали, где каждый новый виток – все тот же процесс, но с новыми подходами и методами.

Длительный период времени сетевые технологии находились в относительной стабильности, не появлялось новых значимых методов и подходов к их развитию в отличие от вычислительного сегмента, находящегося на очередном этапе технологической эволюции. Вычислительный комплекс прошел путь от проприетарных централизованных узлов обработки информации (Мейнфрейм) до распределенных вычислительных кластеров, представляющих собой открытые стандартные вычислительные блоки на базе x86 серверов, без привязки к производителям и технологиям, с новыми методами обеспечения отказоустойчивости в виде промышленной виртуализации и использования облачных моделей. Теперь это высокопроизводительные распределенные горизонтально масштабируемые кластеры без привязки к местоположению – будь то здание, город, страна или континент.

Сетевые решения не развиваются в отрыве от потребностей вычислительного сегмента и предоставляемого им сервиса. Традиционная трехуровневая сетевая архитектура, протоколы, классические подходы к управлению сетью (через командную строку и конфигурационные файлы), методы адресации, механизмы логического деления (VLAN[1] и VRF[2]) и способы назначения правил обработки трафика в настоящее время не отвечают требованиям динамических вычислительных сред, что содействует появлению новых технологий или подходов к построению сетей.

Классическая трехуровневая архитектура долгое время была эталоном ввиду доминирования клиент-серверного трафика, но с кратным увеличением количества межсерверного трафика и необходимостью иметь предсказуемую среду с наименьшим количеством переходов стала приобретать популярность хорошо известная, но забытая архитектура CLOS[3], базирующаяся уже на Layer 3-взаимодействии с отказом от архаичного протокола резервирования каналов STP[4] и использования балансировки трафика между всеми доступными путями (ECMP[5]). Возврат к топологии CLOS позволил добиться требуемой масштабируемости и модульности путем построения и добавления нужного количества модулей для горизонтального расширения и увеличения количества уровней CLOS-архитектуры.

Современные сети – это в первую очередь сети третьего уровня модели OSI[6] со смещенной границей широковещательного домена до коммутаторов, установленных в стойку (ToR[7]), так как все меньше приложений и сервисов требуют Layer 2-взаимодействия в пределах распределенной архитектуры. В качестве основных векторов развития современных сетевых архитектур можно выделить два направления: разработка концептуально новых алгоритмов и адаптация существующих протоколов под текущие реалии повсеместного внедрения автоматизации и алгоритмов программирования, что уже сейчас выливается в появление и разработку сетевых протоколов, таких как RIFT (Routing in Fat Trees), LSVR (Link State Vector Routing).

Вычислительный комплекс всегда требует от сети ресурсов больше, чем она может предоставить, но, несмотря на развитие аппаратной базы и появление высокоскоростных трёхразрядных скоростей интерфейсов, сейчас де-факто для подключения потребителей используются в основном порты со скоростями 1/10 Гбит/c, переход на 40 Гбит/c замедлился, а зачастую не осуществляется и вовсе, поскольку для построения современных вычислительных кластеров предпочтение отдается дроблению блоков и использованию универсальных стоечных серверов вместо закрытых серверных шасси, даже при лоббировании производителей «черных ящиков». Использование стоечных серверов, по субъективному мнению, открывает дорогу перспективным технологиям, обеспечивающим взаимодействие на скоростях 25 Гбит/с.

Производители сетевого оборудования все чаще ориентируются не на проприетарные специализированные чипсеты (Custom Silicon или Proprietary ASIC), требующие полного цикла производства – от разработки до реализации, а на готовые кремниевые чипсеты (Merchant Silicon) для решения широкого спектра задач, доступные на рынке в качестве готового продукта. Именно тенденция к стандартизации в части чипсетов вынуждает крупных игроков сетевого рынка изменять свой подход к его формированию и акцентировать производственные ресурсы на подготовке высокоинтеллектуального программного обеспечения, а не на аппаратной составляющей оборудования, которая уже сейчас превращается в блок сетевых ресурсов, представляющий собой стандартизированный набор портов и микросхем. Тем самым все очевиднее трансформация производителей сетевых решений в производителей программных сетевых решений. Концепция отделения на оборудовании программного обеспечения от нижележащей аппаратной составляющей оборудования получила название «дизагрегация». Возможность использования различных операционных систем в отличие от «традиционного» подхода позволила потребителю получить определенную степень свободы в выборе поставщика программного обеспечения, как когда-то произошло с вычислительными ресурсами.

Для сети передачи данных атомарной единицей сегментации априори являлась VLAN, но сегодня этой гранулярности уже недостаточно, возникла потребность в сдвиге атомарной единицы до уровня сервиса. Как следствие – появление и развитие технологий использования виртуальных сетей (overlay), работающих поверх физического транспорта (underlay), например VXLAN[8], NVGRE[9], GENEVE[10]. Применение перечисленных технологий позволяет абстрагироваться от физической инфраструктуры и осуществлять логическую сегментацию, необходимую для многократного использования инфраструктуры. И тут не обошлось без отголосков прошлого, так как в указанных технологиях реализуется подход, давно используемый для распределенных корпоративных сетей в виде Virtual Private Network (VPN).

Наряду с сегментацией дополнительной проблемой являются требования оптимизации и управления сетевыми потоками высоконагруженных вычислительных кластеров. Увеличение количества решений, основанных на подходе Network Function Virtualization (NFV), где любой сервисный компонент сети может быть представлен в виртуальной редакции, вынуждает строить сложные логические схемы сетевого взаимодействия. Для управления потоками возникла необходимость в расширении служебной информации, передаваемой сетью, и добавлении метаданных к каждому сетевому фрейму и/или пакету. Регулировать растущую многоуровневую транспортную нагрузку на сети призваны разрабатываемые или адаптируемые множественные архитектуры по типу Segment Routing (SR).

Применение overlay-сетей, добавляющее дополнительный уровень сложности при их развертывании и эксплуатации, необходимость интеллектуального управления множественными сетевыми потоками консолидированных по средствам виртуализации сервисов вынудили индустрию искать решения для максимальной автоматизации процессов построения и эксплуатации виртуальных сетей и превращения их в типовые операции, описываемые стандартными методами и моделями с минимальными временными затратами путем внедрения автоматизации и использования концепции программно-определяемых сетей (Software-Defined Network).

Дать четкое определение концепции SDN на текущий момент достаточно сложно ввиду маркетинговой «токсичности» термина. В общем представлении концепция программно-определяемых сетей – это сосуществование сети передачи данных, ориентированной на приложения и сервисы, с использованием идеологии «открытых сетей» (Open Networking). Концептуально в основе SDN лежит идеология отделения функций управления через стандартизированный интерфейс от функций передачи данных с применением централизованного арбитра (контроллера). Базисом идеологии «открытых сетей» являются применение стандартизированных и открытых протоколов взаимодействия и использование абстракции отделения аппаратного и программного обеспечения, где на любых аппаратных ресурсах могут быть развернуты любые программные решения, будь то открытые реализации, разрабатываемые мировым сообществом, или закрытые от традиционных игроков. Основные компоненты SDN помимо «открытых» коммутаторов и overlay-сетей – «мозг» сети передачи данных в виде контроллера и протокол взаимодействия контроллера и коммутаторов. Но и тут монополия ведущих производителей вносит коррективы в эволюцию сетей передачи данных, всячески сопротивляясь внедрению и принятию единых стандартизированных протоколов взаимодействия, а подчас и вольному трактованию самой сути SDN. Примером тому могут служить пробуксовка в части поддержки наиболее стандартизированного на текущий момент протокола OpenFlow и массовый выход на рынок программируемых коммутаторов. К сожалению, именно поэтому сейчас мы имеем псевдо-SDN, представляющую собой не что иное, как хорошо программируемую систему управления, которая обеспечивает автоматизированную конфигурацию стека протоколов – и только.

Особо стоит отметить относительное отставание систем мониторинга для сетей передачи данных, несмотря на наращивание аппаратных ресурсов, программных решений и автоматизацию, которые позволяют извлекать огромное количество телеметрической информации. При этом процедура корреляция подобной информации и ее анализ в большинстве случаев недостаточно автоматизированы. Выход из сложившейся ситуации для осуществления качественного скачка в развитии систем мониторинга индустрии есть – это использование методов искусственного интеллекта в общем и машинного обучения в частности.

Трансформация сетевой инфраструктуры в сторону автоматизации уже сейчас оказывает эффект домино не только на оборудование и технологии, но и на требования специалистов и операторов, эксплуатирующих системы. Годами формировавшаяся парадигма сетевого инженера превращается в парадигму разработчика программируемых сетевых решений с симбиозом знаний о сетевых технологиях и мире программирования.

В заключение хотелось бы отметить, что основными, по мнению автора, драйверами развития сетевой инфраструктуры для вычислительных кластеров будут именно стандартизация и открытость, с уменьшением частных инноваций, препятствующих долгосрочному планированию. Недаром все гиганты индустрии, чувствующие приближение трансформации, входят в консорциумы с основателями идеологии «открытых сетей», руководствуясь принципом «не можешь победить врага – возглавь».

Развитие сетевых технологий в ближайшее время будет связано не с революцией, а с переходом на следующий уровень эволюционной спирали путем усовершенствования и применения существующих технологий. Это станет возможным благодаря консолидации отрасли и принятию всеми унифицированного языка сети передачи данных для вычислительных кластеров, как когда-то было реализовано в сети Интернет с его пусть и не идеальными, но зато одинаково имплементируемыми протоколами.

[1] Сокращение от Virtual Local Area Network.

[2] Сокращение от Virtual Routing and Forwarding.

[3] Сокращение от имени автора, описавшего архитектуру, – Charles Clos.

[4] Сокращение от Spanning Tree Protocol.

[5] Сокращение от Equal Cost Multiple Paths.

[6] Сокращение от Open Systems Interconnection model.

[7] Сокращение от Top of Rack.

[8] Сокращение от Virtual Extensible Local Area Network.

[9] Сокращение от Network Virtualization using Generic Routing Encapsulation.

[10] Сокращение от Generic Network Virtualization Encapsulation.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку