HDS и Sun Microsystems активно демонстрируют свои союзнические отношения на поприще современных систем хранения. Компании ни в чем не конкурируют, более того, по своим подходам и инженерным традициям удачно дополняют друг друга. Очередным их совместным мероприятием в Москве стала конференция «Решения от Hitachi Data Systems и Sun Microsystems для систем хранения и информационно-вычислительных центров», проведенная 18 ноября в Москве

Выступление директора Sun Microsystems по системам хранения Криса Вуда в программе конференции было озаглавлено довольно прозаично «Стратегия построения предприятия центров уровня предприятия». Но как оказалось впоследствии, речь в нем шла о другом. Основное внимание Вуд уделил реализации программы управления жизненным циклом данных (Data Lifecycle Management, DLM) в его компании. В отличие от многих «разъездных маркетологов», Вуд — ветеран отрасли; до прихода в Sun он более двух десятилетий проработал в IBM, где участвовал в разработке систем ввода/вывода для мэйнфреймов System 360/370.

Возможность сборки под одной крышей разнородных устройств открывает возможность для реализации DLM. Параллельно с TagmaStore выпускаются накопители корпоративного уровня Hitachi Lightning 9900 V Series и модульные системы Hitachi Thunder 9500 V

По мнению Вуда, проблемы, связанные со «складированием» данных, вызваны несколькими причинами. К счастью, эти проблемы еще не в полном объеме обнаруживаются в отечественной реальности, однако западное общество уже попало в капкан зависимости от электронных форм хранения данных. Раньше других на формирование более обязательного отношения к данным стали активно влиять разнообразные законодательные инициативы, требующие, чтобы экономические отчетные данные, юридические важные сведения и особенно медицинские карты хранились на протяжении многих десятилетий. Так, по нормам принятого в 1996 году акта Health Insurance Portability and Accountability Act, карты больных должны сохраняться еще сто лет после смерти пациентов. В России эта проблема решается проще — запрещением перевода карт на машинные носители; однако любому здравомыслящему человеку понятно, что это временная мера. Вторая причина — постепенный перевод систем управления предприятиями в режим, близкий к реальному времени; небыстрое, но неизбежное движение в этом направлении наблюдается. Уже сейчас ясно, что в зависимости от актуальности данных меняется их ценность, архивные исторические данные могут стоить на порядки меньше, чем данные, имеющие значение для принятия решения в текущий момент времени. В конце концов, если исторические данные пропадут, это большая, но переживаемая потеря. А вот нарушение бизнеса из-за утраты оперативных данных может привести к краху предприятия. И, наконец, беспроводные коммуникации могут вызвать непредсказуемый рост объемов данных, экзабайтные базы данных уже в ближайшее время станут реальностью.

Первый тревожный признак — рост популярности средств радиочастотной идентификации (RFID). Какие горы данных вырастут после того, как каждый пучок редиски будет снабжен идентификационным ярлыком? А подключение к Сети в режиме реального времени таких устройств, как автомобили, самолеты и даже космические корабли может вообще изменить стратегию построения систем автоматизации. Зачем, спрашивается, ставить на автомобиль десятки диагностических процессоров, если достаточно соответствующих датчиков, которые будут сообщать эксплуатационные параметры в обслуживающие центры? Зачем нагружать космический корабль избыточным компьютерным оборудованием, если более надежные решения можно развернуть на Земле? Процессоры можно оставить непосредственно ворганах управления, там, где время реакции должно быть минимально, решения являются простыми, и копить информацию не имеет смысла.

В Sun готовятся к новой реальности. В числе новых инициатив — имеющая своей целью создание комплекса DLM-инструментов программа 4C (Consolidation, Continuity, Compliance, Content).

Основа для DLM

После выступления Вуда стало понятнее, на что ориентировано способное управлять петабайтами данных решение Hitachi Application Optimized Storage. Анонсированное в мае 2004 года, оно представляет собой интегрированный пакет, состоящий из оборудования и программного обеспечения, а также сервисов, поддерживающих инфраструктуру хранения данных. Практической реализацией этого решения сегодня является универсальная платформа Hitachi TagmaStorе Universal Storage Platform, анонсированная два месяца назад.

Платформенный подход позволяет осуществить поддержку бизнеса в виде сервисов четырех уровней. На нижнем уровне находятся сервисы хранения, которые обеспечивают гетерогенное управление многоуровневой средой хранения, состоящей из быстрых, но дорогих SCSI-дисков, медленных, но недорогих SATA-дисков и, наконец, дешевых лент. (Имеется в виду не собственная стоимость устройств, а стоимость хранения единицы данных: при переходе с уровня на уровень она снижается на один или два порядка.) Сервисы работы с данными обеспечивают резервное копирование, миграцию, репликацию и безопасность физических данных. Управление контентом позволяет интерпретировать «сырые» данные, то есть индексировать, архивировать, выполнять поиск и выбирать нужные логические данные. На уровень выше осуществляется поддержка данных приложений.

Семейство TagmaStore Universal Storage Platform построено на основе коммутаторов; в максимальной комплектации оно допускает хранение в одном устройстве до 330 Тбайт данных и управление виртуализированными данными на различных внешних устройствах общим объемом до 32 Пбайт. Возможность сборки под одной крышей разнородных устройств открывает возможность для реализации DLM. Параллельно с TagmaStore выпускаются накопители корпоративного уровня Hitachi Lightning 9900 V Series и модульные системы Hitachi Thunder 9500 V. Для более долговременного хранения на более поздних этапах жизненного цикла данных HDS производит Serial ATA Intermix Option для Thunder 9500 V. При комплектации этой приставкой систем Thunder 9585V, Thunder 9580V или Thunder 9570V обеспечивается готовое («из упаковки») решение для DLM, сочетающее в себе высокоскоростные диски Fibre Channel и оптимальные по стоимости диски SATA, связанные в одну систему.


От HSM к DLM и далее к ILM

За последнее время в обиход вошли новые технологические понятия: управление жизненным циклом данных (Data Lifecycle Management, DLM), управление жизненным циклом информации (Information Lifecycle Management, ILM) и иерархическое управление системами хранения данных (Hierarchical Storage Management, HSM). Понятия близкие, но не тождественные. Управление жизненным циклом данных сводится к тому, что определяется некоторая категория структурированных или неструктурированных данных, имеющих ту или иную ценность. В частности ценность данных и требования об их сохранности могут быть регламентированы нормативными документами. Затем определяется набор операций, которые можно производить над этими данными, с тем, чтобы обеспечить возможность их переноса по мере неизбежного старения с более дорогих на менее дорогие устройства. В тех случаях, когда регламентируемый срок хранения достигает сотни лет, должен быть продуман механизм миграции на еще несуществующие устройства хранения. Кроме того, DLM предполагает обеспечение возможности для оптимизации работы с архивированными данными. Все, что относится к DLM в конечном итоге сосредоточено на стоимости процессов хранения данных, на стремлении к разумному использованию накопителей. Ключом к DLM является обеспечение миграции данных, на протяжении всего жизненного цикла должна сохраняться возможность восстановления и возвращения на исходные позиции. Очевидно, что HSM служит технической основой для DLM.

Если же говорить о ILM, то из-за противоречий в представлениях о том, что такое информация, существует разнообразие трактовок. Буквально несколько недель назад ассоциация Storage Networking Industry Association (SNIA) предложила собственное определение: «ILM включает в себя политики, процессы, опыт и средства, используемые для объединения полезных качеств информации с точки зрения бизнеса, с возможностями приемлемых по стоимости информационных инфраструктур во времени, на всем протяжении жизни информации, от ее зарождения до потери ценности». Несмотря на витиеватость формулировок, понятно, что речь идет не о специфических продуктах, системах хранения и миграции данных; а скорее, о стремлении связать информацию с бизнес-процессами. Это определение поможет сместить фокус с собственно данных, с гиперболизации значимости их объемов на обсуждение значения этих данных.

Если принять приведенное определение SNIA, то DLM можно рассматривать в качестве инфраструктуры для ILM, точно так же, как HSM является обеспечивающей средой для DLM.

DLM по отношению к ILM осуществляет три основные функции:

  • защита данных на всех уровнях иерархии хранения, включая быстрое и эффектное создание резервных копий и восстановление;
  • сохранение неизменности содержания данных в процессах перемещения шифрования и архивирования;
  • управление ресурсами данных, в том числе классификация данных по категориям, выбор оптимального места хранения по мере накопления и старения данных.

Платформенный подход

Платформенный подход позволяет осуществить поддержку бизнеса в виде сервисов четырех уровней. На нижнем уровне находятся сервисы хранения, которые обеспечивают гетерогенное управление многоуровневой средой хранения. Сервисы работы с данными обеспечивают резервное копирование, миграцию, репликацию и безопасность физических данных. Управление контентом позволяет интерпретировать «сырые» данные, то есть индексировать, архивировать, выполнять поиск и выбирать нужные логические данные. На уровень выше осуществляется поддержка данных приложений.