15.09.2012 13:38

1060 прочтений

Как справиться с лавиной данных посредством флэш-технологии в RAID?

lsiТомас Павел, директор по продажам компании LSI

Сегодня RAID применяется повсеместно как основная технология систем хранения в современных ЦОД. Учитывая развитие облачных вычислений в ЦОД с использованием RAID-технологии и массивными объемами данных скорее всего, так будет и в обозримом будущем. Внедрение корпорациями решений на основе флэш-накопителей является следующим логическим шагом в эволюции технологии СХД, так как разрыв между ростом данных и инвестициями в ИТ-инфраструктуру увеличивается с каждым днем все больше, создавая проблемные «узкие места» в критически важных приложениях.

Так как же компаниям избежать этих «узких мест»? Многие считают, что для этого существуют твердотельные накопители (SSD), которые способны закрыть разрыв между вычислительной производительностью и системой хранения, так как их время случайного доступа и скорость передачи данных намного быстрее при низком уровне задержки последовательного чтения по сравнению с традиционными жесткими дисками (HDD). Стоимость замены всей инфраструктуры хранения данных твердотельными накопителями нецелесообразна с экономической точки зрения. Более выгодным вариантом является разработка способов интеграции флэш-технологии в архитектуру корпоративной системы для получения значительных улучшений работы.

История RAID

RAID определенно проделал длинный путь с тех пор, как в 1978 году Кен Норман Оучи из компании IBM получил патент под названием “Система восстановления данных в отказавшем блоке памяти”, который по существу описывало то, что позже стало RAID 5. Спустя девять лет у троих ученых области ИТ из Университета Беркли (Калифорния) возникла идея объединения нескольких жестких дисков в логическую единицу. В 1988 году они опубликовали статью под заголовком “Массивы резервных недорогих дисков ”, где доступно описали свою основную цель – решение вопросов производительности ввода/вывода. По иронии судьбы, технология, которая была ими впервые предложена, широко распространилась за свою способность улучшать функциональную надежность хранения данных в большей степени, то есть нашла применение за рамками увеличения производительности.

Спустя годы количество стандартных схем RAID эволюционировало и получило название «уровней». RAID 0 увеличил производительность, при этом была потеряна устойчивость к сбоям. В то время как RAID 1 позволял записывать зеркальные данные одинаково на два диска. RAID 2 и RAID 3 и сохраняли последовательные биты и байты на паритетный диск. С RAID 4 файлы распределялись между дисками, которые выполняли операции независимо, позволяя реагировать на запросы параллельно. RAID 5 распределял четность вместе с данными. RAID 6 обеспечивает отказоустойчивость при двух вышедших из строя дисках, делая большие группы RAID более практичными для систем высокой доступности.

Распределение данных на различные устройства в системе RAID может быть внедрено на уровне программного обеспечения или с помощью оборудования. RAID на основе ПО обычно обеспечивается с помощью операционных систем. ОС серверного класса, которые предлагают управление на  уровне логических томов, обычно поддерживают RAID. Некоторые продвинутые файловые системы созданы для организации данных на различных устройствах хранения напрямую. ZFS, например, поддерживает все уровни RAID и любые вложенные комбинации.

На уровне оборудования контроллеры RAID могут поддерживать множество операционных систем и представляют RAID как еще один логический накопитель. Они включают кэш чтения/записи, поэтому могут улучшать производительность. Так как чтение/запись энергонезависимы, текущие записи не потеряются в случае сбоя электропитания до тех пор, пока кэш защищается резервированием. Оборудование RAID предоставляет гарантированную производительность и не добавляет дополнительные вычисления хост-компьютеру, но так как контроллеры используют собственный формат данных, работа с контроллерами различных поставщиков становится невозможной.

Как справиться с лавиной данных?

До сих пор RAID эволюционировал одновременно с предъявляемыми требованиями, но, если задуматься… Согласно исследованиям компании Cisco, сетевой трафик в период до 2015 года будет расти в среднем на 32%. Компания IDC прогнозирует необходимый совокупный среднегодовой 50% темп роста емкости устройств хранения за тот же период. Gartner оценила совокупные ежегодные темпы роста расходов на ИТ в 5%, а показатель расходов на телекоммуникационное оборудование составил 7%.

В то же время, учитывая рост количества данных, создаваемых и используемых по всему миру, разрыв в производительности требует решения проблем RAID, связанных с поддержанием уровня производительности и ускорения обработки данных.  В основном все процессоры достигают скорости записи в 1 наносекунду в кэш-памяти L1, 10 наносекунд в L2 и 100 наносекунд в основной кэш-памяти. Это намного быстрее, чем скорость записи в 10 милисекунд на СХД уровня 1 или в 20 милисекунд уровня 2 и в СХД near-line. Вследствие нарушения иерархичности памяти увеличивается время ожидания.

Такой разрыва в производительности в сочетании с ростом объемов данных и трафика сети создает «узкие места» в инфраструктуре хранения, и компаниям все сложнее извлекать все необходимое из своих данных. Современный мир озабочен данной проблемой, ведь скорость доступа к данным является самым важным аспектом нашей жизни - все хотят получить доступ ко всему и немедленно.

Переопределение производительности ЦОД

Использование систем хранения на основе флэш-памяти с существующими СХД может сэкономить значительные средства, так как многоуровневые дисковые массивы с флэш-памятью на RAID-контроллере (вместе с интеллектуальным ПО) могут заместить огромное количество дисков. Комбинированный подход позволяет компаниям интеллектуально использовать флэш-накопители и существующие жесткие диски, что обеспечивает оптимальное соотношение «цена/качество» в многоуровневой среде хранения данных.

Такой подход был выбран и корпорацией LSI. Ее продуктовый портфель Nytro объединяет в себе флэш-технологию PCIe с ПО интеллектуального кэширования и управления. По данным LSI, подобная комбинация обеспечивает ускорение производительности, которое зависит от конфигураций и приложения, но легко увеличивает производительность различных HDD. Нередко производительность приложение ускоряется в 5-6 раз, а в некоторых случаях, по данным пользователей, в 30 раз.

Флэш-накопители PCIe большой емкости могут использоваться в основной СХД. Флэш-накопители средней емкости, которые сочетают флэш-технологию PCIe с ПО интеллектуального кэширования, способны ускорять работу SAN и комплекса DAS. Флэш-накопители малой емкости, сочетающие карту RAID-контроллера со встроенным ПО интеллектуального кэширования для ускорения DAS несет преимущества флэш «в массы».

Интеллектуальное внедрение флэш-технологий может помочь развитию RAID, решить проблемы, связанные с дисбалансом в производительности систем в условиях увеличивающихся объемов данных. Это особенно актуально в свете недавнего исследования LSI.

Основная проблема ЦОД – влияние потока данных на производительность приложений

Корпорация LSI обнародовала результаты исследования, в ходе которого было опрошено 412 менеджеров ЦОД в Европе. Исследование проводилось с целью получения информации о том, с какого рода проблемами они сталкиваются в своей повседневной работе. Интересным результатом оказался тот факт, что 93% предприятий признают критичность оптимизации производительности в своих ЦОД и сетях, а три четверти из опрошенных считают, что они не достигают необходимого уровня производительности. 

В исследовании LSI менеджеры ЦОД сообщают, что ключевые факторы замедления производительности приложения – это “узкие места” в доступе к сети и хранилищу данных. Такие ограничения являются чаще всего результатом увеличения траффика массивных данных сложных инфраструктур, ограниченных, в свою очередь, медленно растущими бюджетами. В компании LSI это явление называют «разрывом в лавине данных». Разрыв обусловлен трафиком сети и потребностей в дополнительной емкости хранилищ, растущих более чем на 30% в год, в то время, как ИТ-бюджеты и расходы растут намного медленнее, всего на 5 – 7%.  В результате, современный взрывной рост объема данных опережает развитие необходимой для их поддержки инфраструктуры, поэтому менеджеры ЦОД остро ощущают проблему недостаточной производительности.

Основные результаты исследования:

  •  25% менеджеров ЦОД подчеркивают, что недостаточная производительность приложения приводит к потерям прибыли
  •  Два из пяти менеджеров ЦОД обеспокоены влиянием производительности приложения на конкурентноспособность компании
  •  СХД на основе флэш-памяти вызывает повышенный интерес, но бюджеты в этой области все еще очень низкие
  •  70% менеджеров ЦОД  говорят, что сложности с доступом к сети и хранилищу вызывают самые большие проблемы с производительностью, которые ведут к потерям в бизнесе 

Менеджеры ЦОД продемонстрировали повышенный интерес к СХД на основе флэш-памяти. Опрошенные признают, что твердотельные накопители (SSD) могут значительно ускорить производительность приложения. Тем не менее, исследование показало, что почти у половины опрошенных отсутствует бюджет на покупку SSD, и что подобные расходы являются, по мнению менеджеров ЦОД, основной причиной, которая останавливает переход на SSD (92%). Top4 бизнес-критичных приложения – инструменты виртуализации, приложения Microsoft Exchange, SQL Server и Oracle.

Исследование подтверждает необходимость значительных улучшений производительности в ЦОД. Посредством СХД на основе флэш-накопителей в ЦОД можно повысить возврат инвестиций. Исследование показывает потребность дальнейшей совместной производителей и менеджеров ЦОД, чтобы получить все преимущества решений для ускорения работы приложений.

См. также:

QLogic оснастит HBA кэш-памятью SSD

Adaptec представила «самые быстрые» контроллеры RAID

Наступление SSD

 

blog comments powered by Disqus