Андрей Кузьмич: «Большую часть современных корпоративных СХД можно построить на решениях Cisco»

На протяжении многих лет компания Cisco прочно ассоциировалась у нас с сетями, с передачей данных, но сегодня она предлагает корпоративные решения в различных секторах ИТ, не последнее место среди которых занимают системы хранения данных. Рост рынка виртуализации, гиперконвергентных систем, потребность в хранении и обработке больших данных – все эти факторы позволили компании Cisco начать отвоевывать большую долю рынка у конкурентов. Какие тенденции сегодня определяют развитие рынка СХД, что диктуют потребности заказчиков отрасли и куда мы придем завтра, – на эти и другие вопросы нам ответил Андрей Кузьмич, директор по технологиям Cisco Россия и СНГ.

– Сегодня на ИТ-конференциях часто можно услышать, что цифровая трансформация определяется данными. Если в 2000-х гг. фокус вендоров был сосредоточен на ИТ-инфраструктуре, в 2010-х он сместился в сторону приложений, то 2020-е годы будут десятилетием «царства данных». Насколько вы согласны с такой концепцией?

– Взгляд действительно интересный, но давайте все-таки не будем забывать о двух основных задачах ИТ в любой компании. Первая – обеспечение функционирования существующих бизнес-процессов и поддержка во внедрении и развитии новых. Вторая – помощь бизнесу в определении наиболее выгодного в данный момент направления развития и оценка правильности таких решений в прошлом. Дальше уже под эти задачи подбираются инструменты (приложения), и для их работы создается инфраструктура. То, на каком из этих трех этапов в настоящий момент сосредоточен фокус, определяется уровнем технологий «снизу вверх».

В начале 2000-х сама задача построения надежной, производительной инфраструктуры была из разряда сложно решаемых. Итогом этого десятилетия стал массовый переход в 2008–2010 гг. на виртуализацию на всех уровнях: вычислительном, сетевом, СХД. Это позволило «отвязать» цикл обновления ИТ-оборудования от жизненного цикла приложений и, как следствие, создать новые универсальные, типовые решения для построения инфраструктуры, например FlexPod и т. д. Если ранее инфраструктура каждый раз создавалась под конкретное приложение, то сейчас вы просто берете стандартный FlexPod, FlashStack, VersaStack, HyperFlex, масштабируете его под свои нужды и по готовым методологиям запускаете на нем ваши приложения. И мы рады, что такие изменения произошли, ведь именно это было нашей первоначальной целью выхода на рынок серверных решений – поменять подход к построению вычислительной инфраструктуры.

Смещение фокуса на приложения стало заметно в 2013–2014 гг. с появлением концепции программно-определяемого ЦОД. Ведь если инфраструктура нужна в первую очередь для работы приложений, то вполне логично, чтобы приложение могло выстраивать инфраструктуру под себя. И сегодня мы наблюдаем множество технологий, которые продолжают эту идею. «Профиль приложения» в сети ЦОД может полностью сконфигурировать все необходимые приложению настройки на уровне как физических, так и виртуализованных подключений, причем полностью независимо от того, какие аппаратные устройства используются (конечно, они должны поддерживать данный режим работы). Аналогичный профиль приложения в платформе управления ИТ-инфраструктурой может настроить все аппаратные средства (СХД, вычислительную платформу) полностью автоматически. Даже на уровне кампусных сетей уже появляется аналог настроек с помощью профиля приложения: недостаточно сформировать ответ на запрос пользователя – важно его доставить до устройства клиента безопасно и с приемлемым SLA. А если вспомнить, что многие приложения сейчас уходят в облака, то как обеспечить одинаковый уровень, надежности и безопасности для приложения и внутри своей сети, и в облаках различных провайдеров? Сегодня у Cisco существуют решения и для этой задачи. Итогом процесса, скорее всего, станет появление некоего универсального «профиля приложения», который позволит прикладной задаче работать поверх любой совместимой инфраструктуры, настраивая ее под свои нужды.

В настоящее время наблюдается переход от традиционной модели, когда обработка данных тесно связана с ПО, которым осуществляется обработка, к более прогрессивной, когда данные хранятся в сыром неструктурированном виде, в том виде, в каком они были получены из источников, и их обработка происходит только в рамках того или иного бизнес-процесса. Такой подход позволяет использовать одни и те же данные много раз, «отвязать» в определенном смысле обработку данных от процесса сбора и хранения. Именно эта причина привела к появлению концепции больших данных и возрастанию интереса к объектным хранилищам. С этой точки зрения, в следующие десять лет нас ждет развитие такого подхода, когда данные будут собираться и храниться «на будущее», а процессы их обработки будут формироваться одновременно с возникновением новых бизнес-задач.

– Недавно агентство IDC проводило исследование с целью определить готовность мировой экономики к цифровой трансформации. Было опрошено около 800 компаний, по результатам лишь 11% из них можно отнести к числу успешных. IDC назвало эту группу «Data Thrivers» («Процветающие с данными»). Как вы полагаете, каков процент подобных компаний в России?

– Получается, чуть меньше 90 компаний на весь мир. Не так много, правда? В России мы видим похожую картину. Сложно перечислить более десятка компаний, в которых процесс работы с данными находится на действительно высоком уровне. Два-три интернет-холдинга, три-четыре банка, одна-две промышленные компании на подходе, а кто еще? Хотя отдельные шаги делают сегодня многие наши клиенты, более того, мы им активно в этом помогаем. Но цифровая трансформация – это путь, а не проект. Нельзя просто запустить две-три-четыре информационные системы и сказать: «Все, мы трансформировали наш бизнес». Здесь нет готовых рецептов, это путь проб и ошибок.

Мы уже говорили, что в последние годы заметно возрос интерес к накоплению неструктурированных сырых данных. И это правильно, ведь для получения полезного результата важно собрать определенное количество данных, а предсказать заранее, какие именно их свойства в будущем окажутся полезными, зачастую невозможно, и любая структуризация приводит к потере части информации.

Стандартный ход data science проекта таков: сначала определяется длительность цикла того процесса, который нужно оптимизировать, затем собираются данные по трем-четырем циклам и только потом можно приступать к анализу. Если мы хотим улучшить процесс, который длится полгода, то просто не можем завершить проект за семь-восемь месяцев: мы не успеваем собрать данные для анализа. К сожалению, многие компании на рынке этого не понимают и хотят сначала увидеть приложение, которое им поможет, перед тем как принимать решение о минимальных инвестициях в работу по накоплению данных. Именно те немногие, кто поверил в этот подход и начал когда-то хранить данные «на будущее», и находятся сегодня в числе пионеров. Эти компании сейчас могут сосредоточиться на поиске подходов к улучшению бизнеса и написании соответствующих приложений.

– Можно ли уже сегодня говорить о том, что данные становятся одним из основных «средств производства» в экономике, или это будет опережением реальных событий?

– Трудно сказать, какие средства производства являются «основными» на каждом этапе развития, можно говорить лишь о том, в каких областях в настоящий момент есть возможность для прорывных трансформаций. Сегодня во многих производственных отраслях это действительно ИТ и именно в части анализа больших массивов данных. Отчасти это связано с тем, что зарабатывание денег традиционным способом – через разницу в цене – в глобальном мире становится все сложнее. Многие компании, работающие на массовый рынок, где разница в качестве товара зачастую не является определяющей, вынуждены конкурировать по цене. В этом случае для получения прибыли остается только снижать себестоимость или технологические риски через оптимизацию бизнес-процессов либо уменьшать стоимость привлечения и удержания клиентов. Обе задачи подразумевают глубокую работу с данными, и именно поэтому основные направления, где мы сегодня видим проекты по анализу данных, – маркетинг и внутренняя оптимизация. Следующее перспективное направление – машинное обучение, поскольку оно может значительно снизить время поиска новых оптимальных моделей и анализа данных.

– Первоначально компания Cisco прочно ассоциировалась исключительно с сетями, с передачей данных, но сегодня она является одним из ведущих игроков на рынке СХД. Расскажите, как произошла эта трансформация.

– Про ведущего игрока на рынке СХД – это, конечно, преувеличение. Все-таки рынок традиционных систем хранения, которые мы не производим, почти на порядок больше рынка гиперконвергенции. Но растет он всего на 5% в год, и этот процесс замедляется. Гиперконвергентные системы ежегодно растут на 65% (по данным IDC), так что есть все шансы, что к 2022 г. эти рынки сравняются. Мы сами чувствуем этот рост даже в России по тому, как часто к нам приходят заказчики с вопросами про HyperFlex, а также по изменившемуся формату реализации проектов. Хотя сами изменения начались уже почти десять лет назад, и, честно говоря, пройдя этот путь, очень странно слышать, что у кого-то Cisco до сих пор ассоциируется только с сетями. Видимо, эти люди последние десять лет не следили за тем, что происходит в ИТ-отрасли.

С тех пор как в 2009 г. мы пришли на рынок вычислительных систем с платформой Cisco UCS, каждый год, а то и чаще мы анонсировали какое-либо инновационное для этого рынка направление. Да, не все они были приняты заказчиками, однако количество инновационных технологий, которые компания Cisco предлагает или поддерживает, – тот критерий, по которому нас действительно можно записать в лидеры. Также не стоит забывать, что рынок хранения данных – это еще и сети SAN, где мы являемся лидером с нашей линейкой MDS, а также системы управления инфраструктурой, где у нас есть Cisco UCS Director – универсальный инструмент управления всем вычислительным стеком, от СХД до платформ виртуализации. Ни одна другая компания не может предложить настолько полный портфель решений.

– На ваш взгляд, переход на программно-определяемые СХД, о котором не раз говорили эксперты на страницах нашего журнала в прошлом году, – это сегодня общая тенденция или мы находимся лишь на первых этапах такой трансформации?

– Общей тенденцией сегодня это назвать трудно, поскольку пока не все компании осознали даже возможность подобных изменений. Но среди наших клиентов уже немало таких, кто понял, что затраты на СХД можно снизить, порой значительно, перейдя на гиперконвергентные решения. И среди этих компаний сейчас идет планомерный поиск приложений, которые можно перенести на гиперконвергенцию без потери производительности.

Как правило, если приложение не представляет большую монолитную СУБД с таким же монолитным сервером приложений, такой перенос возможен. Очень часто этот процесс сопровождается инвентаризацией имеющихся в компании приложений: ИТ-отделы с удивлением осознают, сколько у них «мелочи», под которую расходовались дорогостоящие ресурсы. Как правило, с таких проектов и начинается осознание перемен, если оно не пришло в компанию ранее.

– Скажите, а что сегодня происходит с крупным традиционными системами хранения? Какие ключевые, определяющие тенденции можно выделить в этом секторе ИТ?

Наверное, этот вопрос лучше адресовать производителям традиционных систем. Мы можем рассказать, что происходит у нас, и немного о наших партнерах.

Если говорить о традиционных СХД, то первым делом возникает вопрос: какой протокол используется для доступа к ним? В 2009 г., выпустив первые коммутаторы семейства Nexus, компания Cisco положила начало широкому применению протокола FCoE в SAN-сетях. Он, конечно, использовался и раньше, но семейство Nexus сделало возможным применение одной пары устройств для работы с сетями LAN и SAN, кроме того, появилась свобода выбора способа подключения для каждого отдельного устройства. И сегодня у тех заказчиков, где сети SAN до сих пор активно используются, такой подход все еще вне конкуренции.

Что же касается других производителей – NetApp, IBM, Pure Storage и т. д., то основные векторы развития – это переход на NVMe-диски, повышение скорости интерфейсов, интеграция с внешними системами управления. Многие вендоры традиционных СХД экспериментируют с гиперконвергентными решениями, хотя нащупать баланс между гибкостью, надежностью и производительностью удается далеко не всем.

– Сравнительно недавно наш журнал писал о гиперконвергентных решениях как о неких «инновационных концептах», а сегодня они уже занимают огромную долю на рынке СХД. На ваш взгляд, чем объясняется такая популярность Cisco HyperFlex?

– Популярность Cisco HyperFlex имеет множество причин. Во-первых, это продукт, основанный на нашем на тот момент более чем семилетнем опыте выпуска собственной вычислительной платформы Cisco UCS. Платформы, которая изменила представление о том, как должен выглядеть сервер с точки зрения администратора. Возможность программной настройки всех характеристик сервера через универсальный API дает одно важное преимущество – мы можем сконфигурировать новую систему полностью автоматически, т. е. быстро и без ошибок.

Во-вторых, система HyperFlex включает сетевую фабрику с самыми низкими в индустрии задержками в передаче пакетов. Это позволяет разработчикам алгоритмов SDS достигать более высоких скоростей чтения и записи без потерь в надежности и масштабируемости. Не случайно HyperFlex оказывается в два раза быстрее своего ближайшего конкурента в тестах производительности (ссылка на данные независимого исследования: http://cs.co/hx-test).

И, в-третьих, это решение целиком от одного производителя, т. е. все вопросы по работе системы заказчик адресует напрямую Cisco. Такая ситуация для рынка почти уникальна. У системы множество преимуществ, но перечисленные мною – основные, наиболее важные для клиентов.

Нам приходилось общаться с заказчиками, попробовавшими другие решения. После демонстрации нашей системы они, как правило, принимают решение в пользу Cisco HyperFlex.

– Я еще помню те времена, когда база данных ассоциировалась с инструментами, позволяющими обрабатывать большие текстовые массивы, но сегодня речь идет о возможности обеспечения хранения больших объемов неструктурированных документов. Насколько готовы к этому современные СХД и что придется менять в подходах и решениях, чтобы научиться работать с неструктурированными данными?

– Задачи обработки неструктурированных данных возникали всегда, но их решение с помощью вычислительных платформ было затруднено вследствие ограничений в емкости и производительности платформ. Неструктурированные данные отличаются тем, что их сложно использовать напрямую – нужно предварительно извлечь из них ключевые признаки, возможно, комбинировать данные за длительный период, чтобы получить требуемый результат. Поэтому единственным разумным способом работы с ними было извлечение и хранение только этих признаков в заранее разработанных структурированных СУБД.

Сегодня ситуация существенно изменилась: ведь те объемы данных, которые еще 15 лет назад считались большими и требовали для хранения и обработки дорогостоящих специализированных дисковых массивов с аппартным резервированием, сейчас свободно помещаются на один-два жестких диска. Возможности по хранению данных внутри серверов также значительно расширились, возросла и вычислительная мощность, которая используется для обработки, а стоимость этих процессов – снизилась. А в силу того, что неструктурированные данные всегда нуждаются в предварительной обработке, логично использовать для их хранения именно внутренние диски серверов. С некоторыми оговорками, это как раз те причины, которые привели к появлению экосистемы Hadoop и индустрии Big Data в целом.

Кластер серверов обеспечивает распределенное хранение и обработку данных, позволяя горизонтально масштабировать ресурсы сколько угодно. И традиционные СХД здесь будут скорее помехой, по крайней мере, в том виде, в котором они существуют сегодня, так как у них есть узкое место – интерфейс, через который осуществляется доступ к данным.

Эти различия становятся более явными, когда заходит разговор о следующем этапе в работе с большими данными – машинном обучении. Ожидания от этого инструмента состоят в том, что он позволит уменьшить объем ручного труда в обработке больших данных, упростить их классификацию, идентификацию различных событий и признаков, автоматизировать работу с потоками данных. Но для своей работы он требует еще больших вычислительных мощностей, особенно на этапе обучения модели, и еще более быстрого доступа к хранимым данным.

Наше видение состоит в том, что для хранения этих данных будут активно применяться объектные хранилища. У нас есть большой опыт реализации инфраструктур для подобных задач: ознакомиться с лучшими практиками можно, например, в документе Big Data Design Playbook (http://cs.co/big-data-playbook).

– А как сегодня в рамках инновационных СХД решаются такие классические задачи, как, например, хранение данных системы резервного копирования?

– Задачи классические, но за последние несколько лет и они существенно эволюционировали. Сегодня бизнес зачастую уже не может ждать несколько часов, пока резервная копия данных СУБД восстановится с магнитной ленты. Большинство компаний давно пришли к хранению резервных копий в виде мгновенных снимков на дисковых массивах.

Второй запрос бизнеса – гарантия, что сохраненная копия данных является «живой», т. е. что приложение из нее восстановится, база данных запустится и т. д. Поэтому вендоры систем резервного копирования предлагают различные механизмы тестирования резервных копий, что также предполагает оперативный доступ к ним. Получается, и резервные копии тоже выгоднее хранить на внутренних дисках серверов? Компания Cisco специально выпустила сервер S3260 для подобных задач, и он сразу же стал популярным у наших заказчиков.

Еще одной тенденцией стал выход гиперконвергентных систем резервного копирования, примером чего может являться Commvault HyperScale. Стоечные серверы UCS C240 под управлением специализированного ПО превращаются в систему резервного копирования с хранением данных прямо на внутренних дисках, с резервированием, горизонтальным масштабированием и т. д. Если вспомнить про HyperFlex, то для него также доступно множество опций: если нужно обеспечить быстрое восстановление виртуальных сред, то для хранения резервных копий можно использовать другой HyperFlex в режиме Standby. При этом он может обрабатывать другую полезную нагрузку, но в случае сбоя послужит точкой восстановления копии виртуального сервера. Если же быстрого восстановления не требуется, то можно использовать систему стороннего производителя, такого как Veeam, установленную на сервере S3260 с хранением информации на внутренних дисках этого сервера. Кстати, и Veeam, и Commvault доступны заказчику из прайс-листа Cisco, т. е. сегодня мы можем предложить рынку полное законченное решение по организации системы виртуализации, включая систему РК. С единой консолидированной технической поддержкой. Вендоров, которые могут в этом с нами конкурировать, можно пересчитать по пальцам одной руки.

Кроме того, мы наблюдаем тенденцию использования объектных хранилищ для хранения резервных копий. Теоретически это должно дать увеличение надежности хранения самих резервных копий. Но будет ли этот подход принят рынком, покажут ближайшие три-четыре года.

– Еще каких-то пару лет назад Big Data были прерогативой таких компаний, как Google или Amazon, а сегодня большими данными занимаются даже крупные агрохолдинги. Какие новые задачи ставятся перед СХД в связи с этой трансформацией?

– Самое интересное, что в задачах обработки больших данных традиционные СХД оказываются по большей части в стороне. Тут можно погрузиться в долгий спор, что является большими данными, а что нет. Если задача компании состоит в том, чтобы накопить большой массив данных, а потом его однократно проанализировать, то традиционные СХД для этой задачи подходят. Но чаще они все-таки являются промежуточным звеном для накопления данных перед их загрузкой в кластер Hadoop или объектное хранилище. В этой роли основные требования к ним – высокая скорость работы и низкая стоимость хранения данных.

– Скажите, а что может предложить Cisco тем клиентам, которым приходится работать с «тяжелыми» невиртуализированными СУБД?

– «Тяжелые» СУБД, или серверы без виртуализации, – это, пожалуй, единственные системы, которые пока не могут быть перенесены на гиперконвергентную платформу. Сюда же можно отнести, в частности, серверы SAP HANA. И для таких случаев у Cisco есть решение, проверенное временем, – сборник валидированных дизайнов (CVD) по построению вычислительных платформ (http://cs.co/dc-design-playbook). Практически для любого корпоративного приложения мы можем предложить подходящий дизайн. Если речь идет о «тяжелых» СУБД, то это, как правило, типовое решение с одним из наших партнеров в традиционных СХД – NetApp, IBM, Pure Storage, EMC.

– Помните старую шутку о том, что «телевидение убьет театр»? Не убило. В свое время HDD не убили ленточные накопители, а SSD не убили HDD. Тем не менее очевидно, что телевидение, так и не убившее (до конца) театр, все-таки перевернуло (без кавычек) мир. Если продолжить сравнение, то насколько SSD перевернули мир корпоративных СХД?

– Ну, в театр мы действительно стали ходить гораздо реже, хотя и помним такие походы дольше, чем многочисленные сериалы по телевизору. А если серьезно, то твердотельные накопители действительно очень сильно поменяли индустрию и продолжают ее менять. Еще каких-то пять-десять лет назад быстродействие дисковой подсистемы являлось ключевым фактором, определявшим возможность или невозможность внедрения приложений и, как следствие, реализации тех или иных бизнес-процессов. В тех случаях, когда это было критично, приходилось либо тратить время на оптимизацию самих приложений, либо строить громоздкие и дорогие решения на основе внешних аппаратных дисковых массивов. Если приложение разрабатывалось силами самой компании, то его оптимизация могла затянуться на месяцы и годы: о каком развитии тут можно говорить?

Появление и, что самое важное, удешевление SSD-накопителей открыло еще один путь – перенести приложение на SSD и потратить ресурсы разработчиков на что-то более полезное, например на разработку новой функциональности. И даже с учетом 30–40% удорожания аппаратной части для тех компаний, которые грамотно оценивают затраты на поддержание бизнес-процессов, этот вариант очень часто значительно проще и выгоднее.

Что же касается HDD, то у них до сих пор есть два важных преимущества – плотность хранения данных на единицу объема и низкая стоимость. Это делает их незаменимыми при хранении больших объемов данных с необходимостью сохранения оперативного доступа к ним в тех случаях, когда лента или другие альтернативные способы не годятся. Файловые, объектные хранилища, резервное копирование, работа с большими данными – вот те применения, где HDD еще долго будут занимать лидирующие позиции.

– Если обратиться к имеющейся у Cisco линейке продуктов в секторе СХД, насколько полно она закрывает все потребности клиентов? В каких зонах корпоративных СХД Cisco обладает наиболее развитой экспертизой?

– Долгое время доминирующим подходом в организации корпоративных хранилищ была консолидация всех данных в рамках единой СХД. До появления современных программных механизмов резервирования данных это был единственный способ обеспечения надежности. Диски виртуальных машин, СУБД, файловые хранилища, а впоследствии и резервные копии – все это хранилось на одном-двух дисковых массивах, подключенных в SAN. Мы сейчас рассматриваем некую среднюю организацию, «общий случай». Если посмотреть на эти данные с точки зрения их объема и выделить только диски «тяжелых» невиртуализованных СУБД, то они занимают не больше 10% общего объема. Эта та часть, где мы видим применение типовых вычислительных блоков. Хранение остальных типов данных уже сегодня может быть полностью выполнено с использованием продуктов Cisco.

Особо нужно отметить, что обработка больших данных в этот анализ не вписывается. Как правило, это новые системы, и их данные на существующих СХД сейчас не хранятся.

Так вот, если говорить исторически, то хранение и обработка больших данных – тот сегмент, где Cisco на сегодняшний день имеет наибольшую экспертизу. Вторым пунктом идут платформы виртуализации – основной сегмент для Cisco HyperFlex. Под номером три – системы резервного копирования и хранения резервных копий.

Главное наше отличие от конкурентных продуктов – подход «много систем – одна вычислительная платформа». Вычислительная платформа Cisco UCS за счет использования механизма централизованного управления серверами через сервисные профили значительно упрощает базовую конфигурацию платформы для любых приложений, в том числе программно-определяемых СХД.

– Если говорить о будущем в перспективе пяти-десяти лет, то куда, на ваш взгляд, будут двигаться корпоративные СХД? И соответственно, в каком направлении будет идти компания Cisco в этой области ИТ?

– Прогнозирование на столь далекую перспективу – задача неблагодарная. Оглядываясь на десять лет назад, понимаешь, что успех многих из внедряемых сегодня технологий тогда было очень сложно предугадать. Исключение составляют, разве что, виртуализация и автоматизация процессов на всех уровнях.

Ключевое слово здесь – «успех». Трансформация ИТ-отрасли, как и любая трансформация, – это путь проб и ошибок. Только циклы в последнее время становятся все короче. Производители, в том числе Cisco, предлагают рынку множество интересных технологий, но какая из них будет принята и получит развитие – сложно предугадать.

Очевидно, что успешные подходы будут строиться вокруг универсальных способов хранения данных, предполагающих доступ к ним множества различных обработчиков. Жизненный цикл данных будет значительно длиннее цикла приложений, которые их обрабатывают.

Сейчас можно долго фантазировать, как будет происходить доступ к данным при переносе приложения с одной платформы на другую, как будет устроен механизм защиты данных от неавторизованного использования. Но я уверен, что рынок со временем все расставит по своим местам.

Андрей Кузьмич: «Большую часть современных корпоративных СХД можно построить на решениях Cisco»

Следите за нашими новостями в
MAX-канале Connect-WIT

Еще по теме

Цифровой девелопмент

Машиностроительные предприятия инвестируют в ПО

Следите за нашими новостями вMAX-канале Connect-WIT

Еще по теме

Цифровой девелопмент

Машиностроительные предприятия инвестируют в ПО

Следите за нашими новостями в
MAX-канале Connect-WIT