Хранение в твердом теле

 

Технологии хранения данных на Flash, или твердотельных накопителях, сейчас активно развиваются. Жесткие диски (HDD) уже достигли физического предела хранения данных, и дальнейшее развитие их технологии проблематично. В то же время развитие микросхем памяти продолжается. Это направление совершенствования систем хранения является сейчас одним из перспективных. Причем уже сегодня твердотельные накопители SSD начинают борьбу за ниши использования, которые традиционно были закреплены за классическими жесткими дисками. В предлагаемом обзоре будут рассмотрены особенности Flash-накопителей, применение их в составе All-Flash-массивов, где механических накопителей уже нет, и те изменения, которые такие высокоскоростные системы хранения могут привнести в бизнес.

Особенности Flash-памяти

Особенностями технологии хранения данных при помощи микросхем Flash-памяти являются:

  • более медленная запись – время записи на порядок превышает время чтения. Впрочем, даже запись все равно оказывается быстрее операций с жесткими дисками, поскольку в микросхемах не нужно позиционировать считывающие и записывающие головки в нужное место диска. Для сглаживания эффекта несимметричности в SSD-накопителях используют энергозависимую оперативную память в качестве кэша – в нее помещаются данные перед записью в память Flash. В результате приложения «не замечают» задержек при записи, однако при неожиданном выключении питания кэш может быть потерян и данные в энергонезависимой памяти могут потерять целостность;
  • ограничение на количество перезаписей – ограниченное количество перезаписей данных в одной ячейке памяти. В результате при использовании SSD в качестве кэша для доступа к наиболее востребованным данным этот ресурс может быть очень быстро исчерпан. Разработчики SSD сглаживают эту характеристику, заменяя блоки наиболее активных ячеек свежими, а также кэшируя наиболее «горячие» данные в оперативной памяти, но полностью убрать ограничение на количество перезаписи нельзя – можно только более длительно использовать этот ресурс. Впрочем, некоторые производители дисков предлагают гарантию на три года с уверенностью, что их SSD выдержат такой срок, не достигнув лимита по количеству перезаписи;
  • объем – до недавнего времени твердотельные диски имели не очень большие объемы. Технология развивалась постепенно, начиная со съемных внешних накопителей для USB. Тем не менее на текущий момент проблема объема практически решена – производители разработали SSD-накопители объемом 3 Тбайт, что соответствует наиболее объемным образцам жестких дисков. Причем если дальнейшее развитие HDD затруднено проблемами с точной механикой привода диска, то твердотельные накопители, очевидно, будут и дальше увеличивать объем. Во всяком случае, технология многослойной Flash-памяти позволяет еще некоторое время наращивать объемы хранения. Таким образом, SSD, скорее всего, очень скоро будут иметь больший объем, чем HDD;
  • стоимость. Проблема объема постепенно переросла в проблему стоимости. При одинаковом объеме SSD обходятся в разы дороже своих жесткодисковых собратьев. Однако сами по себе накопители не представляют ценности – они работают в составе сложных решений. Поэтому уже сейчас готовые решения для высокоскоростных хранилищ, которые применяются, например, в аналитических системах и строятся, как правило, на жестких дисках с высоким количеством оборотов, сравнимы по стоимости с аналогичными решениями All-Flash-массивов. При дальнейшем развитии микросхем памяти, судя по всему, и другие типы систем хранения сравняются по стоимости с дисковыми и вытеснят их. Таким образом, конкуренция между HDD и SSD происходит уже на уровне стоимости, а не объема и надежности.

Гибриды или All-Flash?

Следует отметить, что среда хранения данных у классических дисков и твердотельных накопителей существенно отличается, поэтому и подходы к оптимизации больших хранилищ разные. В частности, для дисковых накопителей основной системой организации является RAID-массив, контроллер которого оптимизирует хранение и доступ к данным. Если распределить данные по дискам массива так, чтобы можно было синхронно их прочитать, то это увеличит общую пропускную способность всего массива. За счет этого RAID позволяет организовать высокоскоростной доступ к данным, даже если каждый отдельный диск работает медленнее. В то же время для SSD нет необходимости создания RAID для ускорения доступа, поскольку твердотельные накопители сами по себе фактически являются RAID-массовом из микросхем Flash-памяти. Поэтому при их использовании не нужны технологии, которые были разработаны для решения проблем механических дисков.

Но самим SSD присущи свои особенности, о которых было сказано выше. Поэтому система хранения должна быть устроена таким образом, чтобы оптимизировать работу SSD. Это означает, что нельзя просто заменить HDD на SSD и все будет работать без проблем. Нужно еще изменить программное обеспечение, которое компенсирует недостатки отдельных накопителей.

Собственно, одну проблему гибридных хранилищ мы уже обозначили – использование SSD в качестве кэша для наиболее «горячих» данных. Действительно, идея кажется логичной – использовать быстрый SSD для хранения оперативных данных, которые постепенно перемещаются на относительно медленные HDD. Однако в этом случае количество записей на микросхемы памяти существенно увеличивается и SSD достаточно быстро может исчерпать ресурс по перезаписи. Необходимо в СХД иметь несколько SSD, а контроллер должен распределять между ними нагрузку таким образом, чтобы максимально эффективно растянуть ресурс перезаписи отдельных дисков. Лучшим решением является построение именно All-Flash-массивов и системы многоуровневого хранения, которая перемещает не очень оперативные данные с SSD на отдельно стоящий HDD-массив.

Следует отметить, что объединение в одном массиве SSD и HDD удорожает решение, поскольку программное обеспечение должно определять каждый диск в отдельности – к какому типу он относится – и в зависимости от этого правильно организовывать работу с ним. При этом программное обеспечение должно включать методы оптимизации работы с обоими типами накопителей, что требует больше ресурсов по памяти и усложняет процедуру работы с накопителями. Если же разделить массивы на All-SSD и All-HDD, то каждый из них можно оптимизировать для работы с конкретным типом накопителей, хотя стоимость массива All-SSD будет выше, чем у дискового собрата, за счет стоимости самих накопителей.

Впрочем, и у массивов All-Flash есть свои особенности, которые связаны с высокой скоростью подобных накопителей. Современные технологии организации сетевого доступа к таким массивам могут оказаться тем самым бутылочным горлышком, которое будет тормозить работу системы. Чтобы полностью реализовать возможности массивов SSD, нужно использовать высокоскоростные интерфейсы доступа. Установка SSD-массива в SAN не решит проблему. Возможно, потребуется модернизация сетевой составляющей SAN для перехода на более скоростные, но и более дорогие интерфейсы. В результате решение с Аll-Flash-массивами может оказаться довольно дорогим и использовать его стоит только в случае, если оно принесет определенные преимущества бизнесу.

Применения All-Flash

Массивы All-flash нужны всем. Генеральный директор ГК «Фаст Лейн» Владимир Княжицкий отмечает: «Прежде всего такие системы хранения подойдут компаниям, которым требуется быстрый доступ к корпоративным данным, когда производится много операций записи-чтения файлов разного размера (т. е. когда эти операции плохо кэшируются). На практике это означает, что… Flash-хранилища хотят все. Почти все. Поэтому в течение ближайших десяти лет все данные будут храниться на твердотельных накопителях». Постепенно все перейдут на Flash-системы хранения, и речь можно вести лишь о скорости и эффективности такого перехода.

Сергей Касаев, руководитель отдела систем хранения данных IBM в России и СНГ предлагает: «Если компания хочет наиболее разумно подойти к построению дорожной карты по замещению СХД на Flash-решения, в первую очередь необходимо построить модель данных с разбиением по уровням хранения (Tier 1 – Tier 4), где Tier 1 – оперативные, критические данные, Tier 2 – финансовые данные или данные с ограниченным доступом. Системы хранения на Flash-накопителях наиболее удачно заменяют именно эти уровни».

Конечно, дорожные карты и инвентаризация данных – это сейчас модно, однако есть и более простые правила. В частности, Максим Захаренко, генеральный директор компании «Облакотека», отмечает: «Сегодня формула такая «Flash – это скорость, магнитные диски – объем». Для задач оперативной работы, размещения баз данных, веб-контента, VDI-сценариев можно и нужно рассматривать системы хранения All-Flash. Для HDD остается ниша хранения архивов, медийного контента и аналогичного, большого по объему, но редко востребованного контента». С ним согласен и Сергей Касаев: «В первую очередь системы полностью на Flash-накопителях необходимо использовать для наиболее высоконагруженных бизнес-систем: аналитических систем, транзакционных баз данных, портальных решений с высокой посещаемостью, виртуальных рабочих столов. Также наметился устойчивый тренд замещения дорогих систем хранения компактными и уже превосходящими их по производительности Flash -решениями».

Павел Стаценко, системный архитектор Fujitsu, приводит список приложений, для оптимизации которых можно использовать массивы All-Flash: «Эффективнее всего использовать Flash-СХД для тех задач, где требуется получить минимальное время отклика от хранилища: это прежде всего приложения бизнес-аналитики и технологии больших данных, т. е. те области, в которых необходима одновременная обработка больших массивов данных. Например, при использовании в ИТ-инфраструктуре банков и других кредитных организаций Flash-технологии позволяют очень быстро запускать кредитные конвейеры, поскольку в этом случае необходимо обрабатывать массивы данных, поступающих от заказчиков, и на основании этих данных выдавать каждому клиенту персональное предложение. Или же, например, в случае с банковской отчетностью – закрытие периода на массивах Flash-накопителей происходит за минуты, а не за часы, как прежде».

Наиболее оптимистично настроенным оказался Анатолий Набока, директор по работе с корпоративными заказчиками компании «Системный софт»: «Если на начальных этапах появления на рынке массивов All-Flash их использование определялось требованиями приложений к высокой производительности систем хранения данных (к примеру, размещение высокопроизводительных баз данных, так называемых золотых образов для загрузки операционных систем в средах виртуализации), то сегодня отмечается доминирование массивов с Flash-носителями в среде корпоративных приложений. Мы ожидаем, что набирающий силу тренд использования производителями систем хранения технологий встроенной компрессии и дедупликации данных позволит в дальнейшем корпоративным заказчикам полностью отказаться от массивов с традиционными накопителями в пользу решений All-Flash. Использование жестких дисков в системах хранения в настоящий момент может быть продиктовано только специфичными техническими требованиями (к примеру, в системах потоковой записи видеоданных)».

Следует отметить, что использование массивов All-Flash совместно с технологиями больших данных может потребовать не только модернизации корпоративной сети и приложений, но и перестройки всех бизнес-процессов предприятия. Если раньше бизнес не мог использовать ретроспективный анализ накопленной о клиентах информации в оперативной работе, то с появлением методов быстрого анализа данных, чему способствуют и массивы All-Flash, может измениться и стиль бизнеса: компании будут делать клиентам предложения, от которых те просто не смогут отказаться. Фактически это означает, что технологии быстрой обработки данных могут стать конкурентным преимуществом компании в период сложной экономической ситуации.

Валерий Коржов, Connect

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку