ЕСЛИ ЦЕНА НЕ ИМЕЕТ особого значения, было бы удобно перенести все данные на накопители на основе флэш-памяти. Они не только значительно опережают вращающиеся диски по скорости работы, но и не имеют движущихся частей, потребляют меньше энергии, не тратят времени на поиск данных и обладают постоянным быстродействием
ЕСЛИ ЦЕНА НЕ ИМЕЕТ особого значения, было бы удобно перенести все данные на накопители на основе флэш-памяти. Они не только значительно опережают вращающиеся диски по скорости работы, но и не имеют движущихся частей, потребляют меньше энергии, не тратят времени на поиск данных и обладают постоянным быстродействием
Фото: Intel

Хотя твердотельные накопители (Solid State Drive, SSD) корпоративного класса стоят значительно дороже накопителей на жестких дисках, устранение дублирования повлечет за собой уменьшение потребности в емкости хранения и превратит флэш-память в достаточно эффективную и высокопроизводительную альтернативу жестким дискам.

«Если цена не имеет особого значения, было бы удобно перенести все данные на накопители на основе флэш-памяти, — говорится в недавнем отчете Forrester Research. — Они не только значительно опережают вращающиеся диски по скорости работы, но и не имеют движущихся частей, потребляют меньше энергии, не тратят времени на поиск данных и обладают постоянным быстродействием. Ни один жесткий диск не в состоянии конкурировать с ними по этим параметрам».

Во внешних дисковых массивах устройства SSD дополняют высокоемкими жесткими дисками SATA, а также обладающими меньшей емкостью, но более высокой производительностью накопителями с интерфейсами SAS и Fibre Channel. Идея иерархической инфраструктуры хранения заключается в том, чтобы размещать на высокопроизводительных накопителях данные, к которым обращение производится чаще всего. А данные, используемые реже, переносятся на более емкие и дешевые жесткие диски.

Производители иерархических систем хранения включают в существующие дисковые массивы высокопроизводительные флэш-накопители, которые устраняют узкие места в подсистеме ввода-вывода. При этом ИТ-администраторы должны знать, какие данные размещаются на SSD. Облегчить их задачу призвано появляющееся сегодня ПО автоматизации иерархического размещения данных.

Высокая стоимость и трудности управления

По мнению Forrester, SSD могут обойтись в десять раз дороже жестких дисков. Другие исследователи говорят о еще более значительном ценовом разрыве. Аналитики компаний iSuppli и Objective-Analysis утверждают, что средняя стоимость SSD составляет приблизительно 17 долл. в пересчете на гигабайт. Ожидается, что в следующем году она уменьшится до 12 долл., а к 2015 году упадет до 5 долл.

Иерархические архитектуры позволяют добиться улучшения производительности и более эффективного использования пространства хранения, но при этом порождают дополнительные трудности, связанные с управлением данными.

Во многих корпоративных ИТ-подразделениях передовые инструменты анализа производительности средств хранения не используются, поэтому сотрудникам приходится вручную определять, каким данным требуется более высокое быстродействие, и вручную перемещать их в нужное место в рамках иерархической архитектуры. Кроме того, подмножества данных, к которым обращение производится чаще всего, имеют свойство меняться с течением времени. Это означает, что в процессе работы ИТ-персоналу придется заниматься мониторингом обращения к данным и их перемещением.

Даже при наличии ПО автоматизации иерархического хранения (например, систем Dell Compellent Fluid Data и EMC Fully Automated Storage Tiering) адаптация существующих систем, не приспособленных для перемещения различных подмножеств томов данных, будет сопряжена с серьезными трудностями.

«Эффективность таких решений с привязкой и без привязки к их стоимости значительно отличается, — подчеркивают авторы отчета Forrester. — За постоянное перемещение придется расплачиваться некоторым снижением производительности. Кроме того, информация, используемая при принятии решений, отстает от текущей ситуации — отсутствие частого обращения к той или иной порции данных в недавнем прошлом вовсе не означает, что этого не произойдет в будущем».

Без повторов

Сейчас в моду входит новая архитектура, полностью построенная на SSD. Встроенная система исключения дублирования данных используется здесь для снижения требований к емкости хранения путем устранения избыточных объемов данных еще до записи их на диск.

Такой подход оказывается даже более эффективным, чем исключение дублирования данных, хранящихся одновременно на устройствах обоих типов. Благодаря более высокой производительности и отсутствию задержек при обращении к данным на SSD обработка процедуры исключения дублирования ускоряется по сравнению с ее выполнением на гибридных и флэш-дисках.

Между флэш-памятью NAND корпоративного класса на одноуровневых ячейках (Single-Level Cell, SLC) и флэш-памятью на многоуровневых ячейках (Multi-Level Cell, MLC) есть весьма существенная разница с точки зрения производительности, срока службы и цены. В одной ячейке памяти SLC хранится только 1 бит данных, а в одной ячейке памяти MLC — 2 или 3 бит. Зато память с одноуровневыми ячейками отличается более высокой производительностью, а срок ее службы в десять раз превышает срок службы MLC.

В настоящее время цена флэш-памяти NAND, выполненной в виде твердотельного диска, составляет примерно 9 долл. за гигабайт для SLC и 3 долл. за гигабайт для MLC. Новый класс флэш-памяти с многоуровневыми ячейками (получивший название enterprise MLC или eMLC) выдерживает в 30 раз больше циклов перезаписи по сравнению с бытовой технологией MLC и стоит на 20% дороже.

Для сравнения, цена традиционных накопителей с интерфейсом Fibre Channel или SAS в пересчете на гигабайт составляет 50-60 центов.

Компании Fusion-io, Texas Memory Systems, Micron и Virident Systems выпускают флэш-карты NAND с интерфейсом PCIe. Цены на такие устройства пока весьма высоки, но то же самое относится и к производительности, которая находится на очень приличном уровне благодаря высокоскоростным межкомпонентным соединениям и близости флэш-памяти к центральному процессору.

В отчете Forrester были рассмотрены SSD-предложения трех производителей: Nimbus Data Systems, Pure Storage и SolidFire.

«Другие поставщики тоже выпускают массивы SSD, — пояснил аналитик Forrester и ведущий автор отчета Эндрю Рейхман. — Но у них нет встроенной системы исключения дублирования, поэтому мы не включали их в наше исследование».

Разработчики Nimbus обеспечивают самую широкую поддержку различных протоколов, предоставляя пользователям возможность подключаться к контроллерам через интерфейсы Fibre Channel, Gigabit Ethernet или 10Gigabit Ethernet iSCSI, CIFS, NFS и Infiniband.

Недавно компания eBay развернула массив Nimbus S-Class емкостью 100 Тбайт, который помог уменьшить потребности в стоечном пространстве на 50% и снизить энергопотребление на 78%. Еще более важным представляется то, что производительность SSD позволила сократить время, требуемое для запуска новой виртуальной машины, с 45 до 5 минут.

Решение Nimbus базируется на двух контроллерах, поддерживающих до 23 серверов хранения высотой 2U, заполненных флэш-памятью eMLC. Система поддерживат до 250 Тбайт дискового пространства. Средства исключения дублирования предоставляются опционально. Цены на свои продукты Nimbus назначает в пересчете на терабайт. За каждый терабайт дисковой емкости клиентам предлагается заплатить 10 тыс. долл.

Компания Pure Storage также поставляет систему с двумя контроллерами общей емкостью до 22 Тбайт. В перспективе разработчики намерены увеличить как ее производительность, так и емкость. Pure Storage предлагает своим клиентам высокий уровень готовности — оба контроллера постоянно находятся в активном состоянии. Внутренняя система сжатия и устранения дублирования постоянно задействована и позволяет обрабатывать блоки размером не менее 512 байт. При розничной цене в 5 долл. за гигабайт массив объемом 22 Тбайт обойдется покупателям в 110 тыс. долл.

И наконец, компания SolidFire в январе планирует представить масштабируемую кластерную систему хранения, наполненную флэш-памятью с многоуровневыми ячейками. Ожидается, что оборудование будет поддерживать устранение дублирования и сжатие данных. Технология тонкого резервирования (thin provisioning) позволит системе выделять серверам приложений дисковое пространство по мере возникновения такой потребности, тогда как при традиционном полном резервировании (over provisioning) все свободное пространство выделяется сразу. Система, которая предлагает гарантированный уровень сервиса, использует только протокол iSCSI. Это делается для того, чтобы удержать цены на относительно низком уровне. Максимальная емкость системы должна достичь 1000 Тбайт, или 1 Пбайт.

Аналитики Forrester предупреждают, что все массивы SSD появились на рынке совсем недавно. Необходимо проверить механизмы создания моментальных снимков данных и выполнения репликаций, а также оценить совместимость систем с имеющимися приложениями.

«Эффективность по отношению к затратам будет определяться темпами снижения цен на флэш-память, — говорится в отчете. — И если вы не устраните дублирование, приблизиться к стоимости жестких дисков вам не удастся».

Улучшение работы средств исключения дублирования требует большой вычислительной мощности процессора (чтобы внутренние процедуры не снижали общую производительность) и эффективного алгоритма устранения дублирования.

«Устранение дублирования позволяет приблизить стоимость твердотельной архитектуры к стоимости жестких дисков, — отметил Рейхман. — Осталось только посмотреть, действительно ли предлагаемая альтернатива жестким дискам окажется жизнеспособной».