Место идеи управления жизненным циклом информации занимают новые подходы к управлению информационными ресурсами предприятий в рамках архитектуры SOA и BI, частью которых оно стало.

В упрощенном виде идея управления жизненным циклом информации (Information Lifecycle Management, ILM) заключается в миграции информации разного типа и различной ценности между несколькими «уровнями хранения». Ценность данных, равно как и потребность в оперативном доступе к ним, обычно снижется по мере их устаревания или изменения приоритетов приложений, поэтому рациональнее переместить их на менее дорогой носитель. Основа ILM — наличие нескольких уровней хранения (первичные, вторичные, архивные системы хранения) с разными показателями производительности и защиты от отказов. Объем данных обычно увеличивается по мере перемещения с первичных систем хранения на архивные, потребность в них снижается, а время доступа возрастает с миллисекунд до минут и часов.

Термин «ILM» получил широкую известность в 2003 г., когда эти решения стала активно продвигать EMC, однако его авторство принадлежит компании Storage Technology, позднее приобретенной Sun Miсrosystems. Аналитики IDC определяют ILM как «миграцию данных разного класса на соответствующие системы хранения согласно их предполагаемой ценности и критериям стоимости, производительности, доступности, времени восстановления, нормативным и организационным требованиям». Впрочем, существуют и другие определения, например, «приведение хранения информации в соответствие с требованиями бизнеса за счет использования правил управления данными и уровней обслуживания, ассоциированных с приложениями, данным и метаданными» (Storage Networking Industry Association, SNIA), «решения, обеспечивающие наиболее эффективное использование инфраструктуры ИТ и помогающие извлечь ценную информацию из массивов данных» (HP) и даже «процесс управления информацией с минимальными затратами». К началу 2005 г. ассоциация SNIA навела определенный порядок в терминологии ILM, сократив число разных интерпретаций, однако и сегодня подход каждого вендора имеет свою специфику.

ЖИЗНЕННЫЙ ЦИКЛ КАК ПРОЦЕСС

По мнению аналитиков Gartner, ILM — на 80% стратегия и лишь на 20% — продукты, а исследователи из Butler Group утверждают, что 90% усилий по реализации ILM приходится именно на стратегию и процедуры и лишь 10% — на технологию. Таким образом ILM — прежде всего процесс, а не продукт. Он требует, чтобы классификация данных и их миграция в инфраструктуре хранения подчинялась неким правилам. Определение ценности данных по времени хранения — самый простой вариант, но далеко не всегда отвечающий задачам бизнеса и требованиям приложений. В этом случае корректнее говорить об управления жизненным циклом данных (Data Life Cycle Management, DLM) — более ограниченной стратегии перемещения данных с целью их защиты, но без учета реальной ценности информации. DLM — одно из подмножеств ILM, как пояснил Алексей Сапожков, руководитель группы продаж систем хранения данных IBM EE/A. Решения DLM (в частности, IBM Tivoli Storage Manager) обеспечивают перемещение файлов в иерархии хранения на основе определенных характеристик. Еще одно важное подмножество ILM — решения управления контентом (Enterprise Content Management, ECM), например IBM FileNet для управления неструктурированными документами различных типов. По словам Дмитрия Матчина, менеджера «HP Россия» по корпоративным системам хранения данных, заказчик заинтересован в том, чтобы управлять только полезной информацией, а остальную он стремится удалять, если нет норм, регламентирующих ее хранение.

С увеличением объемов данных усугубляются проблемы, связанные с архивированием, организацией хранения, собственно хранением и поиском информации, растут затраты на обслуживание ПО управления и разрозненного оборудования, обеспечивающего хранение данных, увеличивается штат системных администраторов. Для реализации более сложных стратегий ILM нередко требуется привлечение консультантов и аналитиков, чтобы оценить ценность тех или иных типов данных для предприятия и определить правила их хранения. Иногда эта задача автоматизируется с помощью ПО, использующего различные методы контекстного анализа (такие инструменты только начинают появляться). Заключительный этап ILM (в понимании SNIA) предполагает интеграцию информационных ресурсов в цепочку бизнес-процессов, упреждающую миграцию данных на основе их содержимого, предоставление сервисов хранения и реализацию информационной инфраструктуры «по требованию», отвечающей особенностям бизнес-процессов. Но все это — задача будущего.

Обычно инфраструктура хранения в ILM состоит из трех уровней: высокопроизводительных дисковых массивов с малым временем доступа, недорогих дисковых систем хранения (SATA/FATA) или систем для хранения больших объемов справочной информации и архивных систем (НМЛ, ленточные библиотеки, стримеры, системы с магнитооптическими накопителями и т.д.). В случае двух уровней речь идет, как правило, о системе архивирования. Архивирование рассматривают и как один из этапов ILM. Конечно, перемещение данных между уровнями хранения желательно автоматизировать: системный администратор задает правила такой миграции, и далее она осуществляется без его участия.

По оценкам HDS, за последние четыре года, включая текущий, оборудование хранения подешевеет на 40-50%. Вместе с тем, затраты предприятий на хранение данных растут и составляют уже 15-20% бюджета ИТ. Предлагая услуги и ПО, производители рассчитывают увеличить прибыльность бизнеса, поэтому концепция ILM заняла важное место в стратегиях развития практически всех ведущих производителей СХД, имеющих обширные линейки ILM, куда входят системы хранения разного типа и класса, ПО управления и услуги.

Рисунок 1. Разработчики HP выделяют пять основных этапов реализации ILM.
В идеальном случае такой подход позволяет оптимизировать затраты на хранение данных и упорядочить работу с информацией. На основе первоначальной оценки и предъявляемых требований может быть разработан общий проект среды ILM, определены классы устройств хранения и правила их использования, подготовлен проект внедрения, а расходы и выгоды подтверждены соответствующими документами. Начав с существующей инфраструктуры, ее можно расширять, внедряя совместимые с ITIL методы использования открытых систем, отмечают в IBM. Специалисты HP выделают пять этапов внедрения ILM (см. Рисунок 1). Нередко организации начинают с реализации многоуровневого хранения с целью сокращения дальнейших расходов, или развертывают системы архивирования для долговременного хранения данных.

Применение методов ILM помогает добиться еще большей экономии и выстроить иерархию уровней хранения с учетом задач бизнеса. Однако очень часто для этого приходится перестраивать работу всей организации, что и сложно, и дорого, поэтому более вероятна частичная реализация некоторых принципов ILM. Такой точки зрения придерживается Римма Владимирова, менеджер по продажам систем хранения данных представительства Sun Microsystems.

СЕГМЕНТЫ РОСТА

Мировой рынок ПО управления хранением данных уже более трех лет демонстрирует стабильный рост. В IV квартале прошлого года его оборот превысил 2,6 млрд долларов, увеличившись на 3,1% относительно предыдущего аналогичного периода, причем наиболее быстрыми темпами (25,5%) развивается ПО архивирования и Hierarchical Storage Management (HSM). EMC лидирует в этом сегменте с долей 27,9% (по обороту в IV квартале), опережая Symantec (18%), IBM (12,1%), Network Appliance (9,6%), HP (5,4%) и CA (5,0%). В России рост составляет 25% в год.

Развивается и рынок оборудования. По данным IDC, в прошлом году в число ведущих поставщиков внешних СХД на российский рынок входили HP (29% рынка по обороту), EMC (17%), Sun Microsystems (16%), HDS (9%) и IBM (7%), а рост его превысил 30%. Оборот мирового рынка дисковых и ленточных СХД достиг 28,2 млрд долларов. IBM имеет долю в 22,2%, HP — 20,9%, а EMC — 13,2%, однако HP лидирует по количеству проданных СХД. HP и IBM располагают также развитым ПО управления серверами и СХД, что позволяет предлагать комплексные системы. Активно развивает ПО управления компания EMC. В «магическом квадранте» Gartner среди лидеров ПО управления ресурсами хранения (Storage Resource Management, SRM) в 2006 г. присутствовали EMC, HP и Symantec, а в 2007 г. IBM.

По информации IBM, ежегодно объемы данных растут более чем на 50% (в EMC говорят о 30%-70%), хотя в большинстве случаев дисковые СХД заполнены менее чем наполовину. Кроме того, в мире действует более 20 тыс. нормативных актов по хранению данных. Поэтому ILM предлагается как решение, помогающее контролировать рост объемов данных.

Между тем два-три года назад компании не были готовы к внедрению ILM, отмечают аналитики Gartner. Такие решения применяли около 5-10% компаний, хотя более половины планировали их покупку в ближайшие два года. За короткое время ILM трансформировалась из маркетинговых стратегий в реальные решения, что отразилось на ее перемещении с 17-го на первые места в списке приоритетов CIO (по информации TheInfoPro). Как показал опрос 4000 менеджеров ИТ, проведенный Peripheral Concepts в США в прошлом году, 45% компаний уже внедрили ILM на том или ином уровне, и 13% планируют это сделать в течение года. Многие вендоры добились заметных успехов в воплощении стратегий ILM в конкретных решениях, в том числе в тиражировании решений для различных отраслей.

Сегодня интерес к ILM подкрепляется рядом факторов. Это и быстрый рост потребности в продуктах архивирования и HSM, и отставание технологий управления данными от увеличения их объемов. Последнее обстоятельство требует внедрения новых подходов, тем более что более 80% всего объема приходится на неструктурированные данные. По прогнозам Radicati Group, к 2009 г. объемы корпоративной электронной почты вырастут на 125%. За рубежом востребованы решения, помогающие привести методы хранения данных в корпоративной среде в соответствие с государственными, отраслевыми и корпоративным нормативами. Российские законы «О связи», «Об архивном деле», рекомендации, действующие в отечественной банковской отрасли, тоже содержат подобные положения. Среди других факторов — потребность в сокращении затрат на управление информацией и постепенное снижение стоимости носителей.

Сервисные подразделения производителей и системные интеграторы накопили определенный опыт внедрения ILM. Услуги — необходимая составляющая, поскольку реализация ILM обычно представляет собой серьезный интеграционный проект. Как правило, при этом преследуются цели снижения ТСО, соответствия нормативным требованиям, задачам бизнеса или уровню сервиса (SLA), повышение степени доступности данных.

Казалось бы, отмеченные выше факторы должны еще больше подогреть интерес к концепции ILM. Однако напротив, шумиха вокруг нее заметно поутихла. Активное продвижение ILM не было поддержано разработкой достаточного спектра готовых решений, охватывающих все этапы жизненного цикла информации. Сегодня высказываются мнения, что идея ILM себя изживает, но производители СХД вовсе не собираются от нее отказываться, хотя и делают ставку на «всеохватывающие» подходы. Они намерены предложить заказчикам более широкие возможности, несмотря на то, что стратегические цели ILM пока не достигнуты. Между тем Алексей Сапожков считает, что хотя об ILM стали писать и говорить меньше, чем пару лет назад, это не означает, что интерес к таким решениям снизился. Скорее напротив, концепция превращается в рабочий инструмент, а количество внедрений растет. Сегодня вряд ли можно говорить о «вялых продажах» решений ILM, хотя ILM охватывает большую группу предложений, включающих оборудование, ПО, сервис и консалтинг, в разной степени востребованных рынком. По словам Риммы Владимировой, стратегия ILM расширилась в сторону соответствия требованиям к хранению информации (WORM), безопасности и обеспечения доступности данных.

Стратегия ILM ориентирована в основном на средние и крупные организации, однако в IBM не считают ее прерогативой лишь крупных компаний. Размер организации не обязательно соотносится с объемом информации, с которым ей приходится работать, а многообразие выбора позволяет подобрать решения практически для любого бюджета.

ЗА РАМКАМИ ILM

Сегодня заказчикам предлагаются более широкие функции управления информацией и ресурсами хранения, системы управления контентом, архивирования и защиты данных. На передний план выходят концепции сервисов хранения и бизнес-анализа (Business Intelligence, BI). На уровне систем хранения и управления ресурсами реализуются идеи сервис-ориентированной архитектуры (SOA). Развиваются принципы автоматизации управления данными. Таким образом, ILM становится частью более широкого подхода.

Как известно, процессы размещения, миграции и удаления данных автоматизированы, однако классификация данных и задание правил, а также управление доступом к ним требуют четкого понимания, какая именно информация наиболее важна для бизнеса. Кроме того, необходима «подстройка» ILM под меняющиеся задачи и требования. При реализации проектов ILM, как отмечает Дмитрий Матчин, возникают организационные проблемы, приходится разбираться во взаимосвязях и потоках документов в компании и выявлять все требования для формализации в виде правил или SLA. Без помощи внешних консультантов описать процесс управления информацией на протяжении ее жизненного цикла весьма сложно, производители же пока только разрабатывают инструменты для автоматизации классификации данных. Например, в HP создают централизованный менеджер правил ILM. EMC в конце прошлого года выпустила ПО Infoscape с функциями классификации файлов по различным категориям на основании собранных метаданных.

HP еще несколько лет назад предложила свой подход к ILM, а в прошлом году представила ряд новых продуктов и усовершенствований: системы для непрерывного сбора и обработки информации HP StorageWorks Continuous Information Capture и HP StorageWorks Reference Information Manager for Files, решение для виртуализации дисковых массивов разных производителей HP StorageWorks 200 Virtualization System (оно упрощает миграцию данных), ПО восстановления HP StorageWorks Application Recovery Manager для SQL Server и Microsoft Exchange. Новые версии системы HP RIM for Databases предназначены для управления ростом объемов данных и их перемещением, а программное обеспечение HP OpenView Storage Data Protector отвечает за резервное копирование. ПО HP File Migration Agent (FMA) и новое решение File System Extender (FSE) осуществляют миграцию данных с дисковых массивов, например, HP EVA и XP на ленточные или дисковые архивы. Миграция прозрачна для пользователей, а клиентский компонент позволяет задавать ее правила.

В настоящее время предложения HP в области ILM охватывают все этапы жизненного цикла информации, причем для каждого предлагается набор решений, нацеленных на снижение расходов на управление, соблюдение нормативных требований и повышение эффективности бизнеса, утверждают в HP. Сервисы ILM используются для сбора, управления данными, их доставки и хранения, а технологии ILM рассматриваются как один из элементов построения адаптивной инфраструктуры HP.

Рисунок 2. Архитектура решений HP ILM в составе ЦОД включает платформы управления (Storage Essentials), системы оперативного, справочного и резервного хранения данных, средства защиты данных (Data Protector) и приложения ILM. Платформы хранения StorageWorks позволяют строить иерархические системы.
RISS — флагманский продукт HP в семействе решений ILM (см. Рисунок 2). Он базируется на сетевой архитектуре HP Storage Grid и состоит из типовых модульных «интеллектуальных ячеек». Каждая ячейка — стандартное устройство оперативного или долговременного хранения с процессорной мощностью. В RISS используются серверы HP ProLiant DL360 G3, ProLiant DL140 или HP ProLiant DL380, а также коммутаторы HP ProCurve. Все оборудование смонтировано в стойке 19″. Систему можно масштабировать, добавляя ячейки (по 1,4 Тбайт), тем самым ее базовую емкость в 2,8 Тбайт (без сжатия) можно увеличить до 350 Тбайт. Применительно к задаче хранения электронной почты это составляет около 7 млрд сообщений. Все решение построено на стандартном оборудовании HP (что упрощает обслуживание) и представляется как единый объект управления и администрирования. Оно позволяет создать архив электронной почты (HP RISS в сочетании с RIM for Messaging), цифровых видео- или аудиофайлов и т.д. с быстрым поиском и извлечением данных по содержимому и атрибутам. Для поиска информации (с распараллеливанием запроса по ячейкам) используются технологии, разработанные некогда компанией DEC для сервиса AltaVista.

RISS (или недорогие массивы с дисками SATA/FATA) используется в модели ILM в качестве вторичной системы хранения, куда перемещается информация, оперативный доступ к которой не требуется. Актуальные данные хранятся на дисковых массивах HP серии XP или EVA с малым временем отклика. Третий уровень составляют ленточные библиотеки. HP предлагает широкий спектр ленточных накопителей и оптических устройств хранения (серии MLS и E, Ultra Density Optical Juke Box). ПО HP Storage Essentials 5.1, интегрируемое с System Insight Manager (SIM) 5.1, позволяет управлять СХД разных производителей, реализует управление серверами и СХД с одной консоли, поддерживает стандарт управления SMI-S. Специальные решения разработаны для баз данных (RIM for Database Archiving), систем электронной почты (RIM for Messaging) и других приложений (RIM for Medical Imaging) (см. Рисунок 3).

Рисунок 3. Связь между инфраструктурой приложений и инфраструктурой хранения в HP RISS осуществляется с помощью ПО. Например, RIM for DB помогает управлять ростом объема баз данных за счет перемещения редко используемых данных в архивную базу и предоставления прозрачного доступа к архивным и оперативным данным. Снижение объема рабочей базы данных (Sybase, Oracle, Oracle E-Business Suite, PeopleSoft или SAP BI) позволяет повысить производительность и стабильность работы приложений, сократив затраты на администрирование. К концу года планируется поддержка Microsoft SQL Server.
Как поясняет Дмитрий Матчин, с точки зрения ILM раздельные процессы создания, идентификации, защиты, поиска, размещения, представления и удаления данных должны быть автоматизированы. Задав критерии ценности информации, время ее хранения на тех или иных носителях, администратор получает полный контроль над ее жизненным циклом. Цель состоит в достижении максимального эффекта от ее использования. Для этого в HP разработали набор продуктов и услуг (консалтинга, разработки архитектуры и внедрения), предназначенный для предприятий разного масштаба и сферы деятельности.

Решения НР по оптимизации бизнес-технологий включают услуги, помогающие «синхронизировать» бизнес и ИТ, управлять сервисами и автоматизировать ILM в комплексе. В России их предлагает консалтинговое подразделение HP C&I (Consulting and Integration), обладающее своей методологией построения ILM. Кроме того, имеются системные интеграторы, способные вести крупные проекты, где требуется анализ потребностей клиента, разработка архитектуры решения и стратегии сбора и миграции данных, определение политик хранения и т.д. Они руководствуются собственной методологией, приближенной к российской действительности. Планируя дальнейшее развитие продуктов и технологий ILM, в HP ожидают продолжения стандартизации и появления новых решений для SMB.

На форуме «Новые грани IT. Технологии успеха в бизнесе» НР представила решения и услуги для оптимизации информации и управления потоками данных. Они нацелены на снижение рисков и управление ими, ускорение роста бизнеса, сокращение расходов. Решения для оптимизации информации включают в себя два компонента — BI и ILM. Задача состоит в том, чтобы консолидировать разрозненные технологии, оптимизировать информационную инфраструктуру, помочь компаниям принимать обоснованные решения и управлять критически важными данными на протяжении их жизненного цикла. В HP над продуктами и услугами BI работают около 2000 сотрудников, и в это направление инвестируются миллиарды долларов. Новое поколение систем для бизнес-анализа HP Neoview включает серверы HP Integrity, ProLiant, СХД StorageWorks и коммутаторы FC, они масштабируются до 256 процессоров и 96 Тбайт данных. Решение HP Oneview, построенное на основе мощной платформы хранения HP Neoview, использует приложение BusinessObjects XI для анализа, отчетности и обработки результатов. Покупка в этом году консалтинговой компании Knightsbridge Solutions Holdings и альянс с Business Objects нацелены на укрепление позиций HP на новом для нее рынке BI.

Повышение ценности информации для бизнеса, наряду со снижением TCO, рассматривается как важный результат внедрения стратегии ILM и в EMC. Между тем в Sun четко разделяют BI и ILM. По мнению Риммы Владимировой, задача ILM — не повысить ценность информации, а оптимизировать хранение в зависимости от ее ценности. ILM помогает управлять хранением для снижения его стоимости.

РАСШИРИТЬ И УГЛУБИТЬ

Cотрудники EMC отмечают, что ни один производитель не может решить весь круг задач управления информацией, однако политика приобретений сторонних разработчиков и технологий позволила компании создать обширную линейку программных и аппаратных продуктов ILM, охватывающую как уровень СХД, так и уровень бизнес-приложений, а отраслевые альянсы помогают дополнить эту вертикаль горизонтальными решениями верхнего уровня. EMC — один из главных проповедников ILM. C 2003 г. она инвестировала в ILM уже 5 млрд долларов и, по данным Gartner, является лидером на рынке корпоративных решений управления контентом (ECM), обеспечения соответствия нормативным требованиям (сompliance) и поддержки полного жизненного цикла хранения информации. Пожалуй, EMC (как и HDS) не хватает лишь обширной линейки ленточных накопителей (важного элемента ILM), какой обладает IBM.

Программная платформа EMC Documentum обеспечивает управление любыми типами неструктурированной информации и бизнес-процессами, связанными с ее обработкой. Она предлагает полный набор средств ILM — от создания информации, поиска и распространения, ее защиты, использования в бизнес-процессах до интеграции с другими корпоративными приложениями, например Microsoft SharePoint 2007. По словам Владимира Прожогина, директора по развитию бизнеса EMC в России и СНГ, Documentum дополняет SharePoint функциями ILM, возможностями классификации и вывода консолидируемой информации на вторичное хранилище.

Для переноса информации из SharePoint в хранилище Documentum можно задавать около десятка разных правил. Предусмотрена и функция гарантированного уничтожения данных по окончании срока их «жизни». Для оптимизации долговременного хранения и преобразования контента предлагаются продукты EMC Archive Services for SharePoint и Content Services for SharePoint. SharePoint выступает в роли клиента в инфраструктурном ПО Documentum. Роль вторичной системы хранения играет EMC Centera.

Еще одна совместная разработка EMC и Microsoft — хранение и защита данных в MS Exchange (см. Рисунок 4). EMC предлагает EmailXtender — централизованное решение архивирования, выполняющее сжатие и дедупликацию данных, а также формирование полнотекстового индекса. Оно предоставляет прозрачный доступ к архиву почтовых сообщений, обладает масштабируемостью, позволяет динамически наращивать емкость, обеспечивает гарантированное удаление файлов и режим однократной записи (WORM). Предложение EMC не уникально, хотя предлагаемые производителями системы архивирования электронной почты отличаются мощностью, емкостью и масштабируемостью. Один из похожих продуктов — Symantec Enterprise Vault 7.0 с механизмом Automated Classification Engine для уменьшения объема архивов и времени поиска за счет категоризации данных. В нем используется 50 стандартных критериев и поддерживается неограниченное количество определяемых правил.

Рисунок 4. EMC предлагает комплект продуктов, позволяющих гибко интегрировать Office SharePoint Server 2007 и EMC Documentum.
Для телекоммуникационной от-расли предназначено решение EMC Documentum Archive Services for Reports, обеспечивающее сбор, хранение и доступ к данным CDR для биллинга, анализа и предоставления информации. В сентябре прошлого года EMC объявила о новом ПО Infoscape и услуге EMC Information Management Strategy Service, которые должны помочь в поиске, классификации и управлении неструктурированной информацией. Infoscape дает возможность автоматизировать и координировать услуги ILM путем оценки важности информации и выполнения политик для достижения требуемого уровня SLA. По словам Владимира Прожогина, ПО и услуги — важное направление в бизнесе EMC. Производитель систем хранения постепенно превращается в разработчика средств управления информацией.

Сегодня в EMC говорят о том, что компания «переросла ILM и смотрит на мир более широко». Ее маркетологи пока не ввели в оборот терминологию SOA, однако предлагаемая EMC информационная инфраструктура для ILM (см. Рисунок 5) вполне вписывается в эту модель. Сегодня в EMC предпочитают говорить об управлении информационной инфраструктурой и в качестве фокусных направлений называют развитие системы управления ресурсами (на уровне СХД, серверов, сети и приложений) для оптимизации предоставления услуг и системы безопасности, охватывающей разные уровни.

Рисунок 5. Информационная инфраструктура EMC для реализации системы управления жизненным циклом информации для клиентов.
Модель управления EMC включает функции корреляции событий в разных средах, установление взаимосвязи между серверами, СХД, сетями и т.д. Инфраструктура EMC Storage Insight на базе технологии Smarts позволяет управлять несколькими средами и определяет воздействие на бизнес-процессы. Microsoft намерена лицензировать комплекс EMC Smarts для определения и отслеживания состояния сети. EMC Smarts планируется интегрировать с Microsoft System Center Operations Manager — комплексным решением для мониторинга работы служб в корпоративной среде. В марте, в рамках реализации данных планов EMC выпустила продукт Smarts Connector для Microsoft System Center Operations Manager 2007. Эти разработки должны усилить позиции EMC в области средств управления.

ИНФОРМАЦИЯ ПО ТРЕБОВАНИЮ

Способность предложить широкий спектр интегрированных решений и комплексные системы управления данными, позволяющие получать информацию по требованию и обладающие широкими возможностями, IBM считает своей сильной стороной, утверждая, что ни HP, ни EMC не располагают подобным ассортиментом. Заказчикам предлагаются полные решения ILM, усиленные многофункциональным ПО управления — важным компонентом эффективного использования информации в режиме «по требованию». По данным IDC, в I квартале 2007 г. IBM увеличила (по сравнению прошлым годом) продажи ПО для систем хранения на 11,5%, опередив по этому показателю HP и Symantec.

В IBM отмечают, что ILM и BI все теснее переплетаются между собой в области автоматического управления данными. Она активно работает над компонентами, ответственными за работу с контентом, и приобретает компании, ведущие разработки в этом направлении. Более 4500 ее заказчиков уже выбрали в качестве основы для своего бизнеса концепцию SOA — стратегию многократного использования технологий ИТ, которая обеспечивает более полное их соответствие потребностям бизнеса. На это нацелены мощные ресурсы таких направлений, как бизнес-консалтинг, сервисы ИТ и ПО, однако в области систем хранения идеи SOA пока не получили развития.

Проблемами управления большими объемами данных в условиях ограниченных бюджетов и извлечения из них ценной для бизнеса информации IBM занималась еще до появления термина ILM, но к числу наиболее активных проповедников ILM не относилась, хотя и имеет четкую стратегию в этой области (см. «Ресурсы Internet»). Ее решения включают в себя, прежде всего, продукты IBM System Storage, ПО Tivoli и DB2. Они опираются на многоуровневую иерархию систем хранения. Дисковые системы IBM (включая продукты среднего класса DS4000 и системы корпоративного уровня DS6000 и DS8000) и НМЛ предлагают возможности построения такой иерархии (см. Рисунок 6). Система IBM System Storage DR550 дополняет ее комплексным решением, управляемым на базе правил и использующим носители WORM. Решения ILM требуют тесной интеграции с приложениями, поэтому связующее ПО IBM DB2 Content Manager, IBM DB2 Records Manager и IBM DB2 CommonStore являются их ключевыми компонентами, наряду с IBM Tivoli Storage Manager (средство для управления архивами) и IBM TotalStorage Productivity Center (TPC) — продуктом мониторинга и управления многоуровневой средой хранения.

Рисунок 6. Реализация ILM для Microsoft Exchange предлагается специалистами КРОК на основе продуктов IBM.
IBM SVC (SAN Volume Controller) позволяет создавать консолидированные информационные хранилища, состоящие из СХД разных типов, классов и производителей, и объединять неоднородную инфраструктуру хранения в единое управляемое информационное хранилище. Виктор Смирнов, руководитель направления IBM System Storage (IBM EE/A), утверждает, что по средствам виртуализации модернизированное решение IBM SVC 4.2 не уступает обновленным версиям HDS USP V (см. врезку «Виртуализация в иерархии хранения»).

Лидируя, по данным мартовского отчета IDC, по продажам НМЛ, IBM остается сторонником этого вида носителя. В компании отмечают, что стоимость хранения на ленте и показатели TCO пока недостижимы для альтернативных технологий. IBM обновила линейку ленточных накопителей и перевела их на картриджи формата LTO4 (800 Гбайт без уплотнения) со скоростью доступа 120 Мбайт/с. В этом оборудовании реализовано большинство технологий, внедренных в дисковых накопителях, включая RAID. Виртуальные ленточные библиотеки (VTL) могут выступать в иерархических системах в роли кэширующего устройства между серверами или СХД первого уровня и физическими НМЛ.

Располагая одним из крупнейших сервисных подразделений IBM Global Services (IGS), компания внедряет свои разработки в различных вертикальных отраслях, причем в них используются не только решения IBM. Ряд разработок затем тиражируется для компаний разного размера. Пример подобного подхода — продукты и услуги серии IBM Digital Media. Это профессиональные решения для телестудий, библиотек, архивов, ориентированные на хранение информации в различных форматах. Они применяются административными и силовыми ведомствами, используются в национальных проектах, образовании. Для медицины разработаны решения, позволяющие архивировать изображения (Picture Archiving and Communication System, PACS).

В нескольких отечественных телекомпаниях внедрены решения IBM Digital Media Center (DMC), обеспечивающие работу с видеоконтентом (подобные предложения имеются и в арсенале EMC). Основу DMC составляют серверы IBM xSeries и pSeries, дисковые системы FastT600/900, модули расширения EXP100 SATA, EXP400 Direct Attached SCSI, EXP700 Fibre Channel, ленточные накопители LTO и Jaguar, роботизированные НМЛ IBM 3584, а также решения партнеров. По словам Виктора Смирнова, DMC реализует намного более широкие функции, чем ILM. Пример другого тиражируемого решения — Grid Medical Archive Solution (GMAS). Оно объединяет системы хранения, серверы, ПО и услуги IBM и предназначено для организации хранения медицинской информации.

В Sun Microsystems отмечают, что в отличие от управления информацией, где рассматривается более широкая область окружения ИТ и бизнес-процессы на всем их протяжении, стратегия ILM традиционно ограничивается узким кругом задач хранения. Sun предлагает стратегию и количественные оценки для ее внедрения. Покупка StorageTek в 2005 г. оказала заметное влияние на рынок ILM: Sun приобрела лучшие на тот момент предложения в области ILM, получила возможность объединить их с сильной линейкой собственных продуктов, включая серверы и ОС, и стала крупным игроком, предлагающим полный спектр продуктов ILM. Одна из флагманских разработок Sun — система хранения StorageTek 5800 класса CAS.

По словам Риммы Владимировой, ILM подразумевает классификацию информации на всех этапах ее использования в бизнес-процессах предприятия, минимизацию стоимости хранения за счет различных технологий, защиту данных, организацию доступа и долгосрочного хранения данных в соответствии с регулирующими правилами и задачами предприятия. Как и другие вендоры, Sun использует ILM для продвижения программных, аппаратных и сервисных решений. Поскольку в ILM вовлечены практически все бизнес-процессы предприятия, для разграничения уровней доступа и ответственности, повышения безопасности и доступности хранения данных используется концепция Identity-Enabled ILM, которая предусматривает применение ПО IdM (Identity Management).

Рисунок 7. Цель «модели зрелости» Information Management Maturity Model (IM3) от Sun Microsystems — наметить четкий путь реализации ILM путем оценки и исследования существующей инфраструктуры заказчика.
Кроме того, Sun предлагает модель, где определяется пять этапов зрелости процесса управления информацией (см. Рисунок 7). Речь идет об автоматизации процессов хранения, консолидации, виртуализации, стандартизации сервисов, привязке задач и процедур хранения к требованиям бизнеса и приложений, причем конечный этап перекликается с подходами IBM: инфраструктура и сервисы хранения «по требованию», повышение эффективности бизнес-процессов и управление на основе содержимого, от которого зависит место хранения информации.

ХРАНЕНИЕ КАК СЕРВИС

В стратегии Hitachi Data Systems концепция ILM всегда занимала весьма скромное место. В компании не отвергают ILM, поскольку концепция одобрена SNIA, но продвигают иные подходы. HDS позиционирует себя в качестве поставщика решений, оптимизированных для приложений (Application Optimized Storage, AOS). По словам бывшего исполнительного директора HDS Дейва Роберсона (ниже генерального менеджера HP StorageWorks), ILM в ее нынешней реализации рассматривается как перемещение данных на соответствующий им уровень хранения. В понимании HDS она является частью AOS. Такой подход может быть эффективным, только если учитываются требования приложений. Большое значение придается оказанию профессиональных услуг — консалтингу и обучению партнеров, помощи при оценке инвестиций в хранение, анализу рисков, выработке стратегии, определению срока окупаемости. Как поясняет Сергей Карпов, глава представительства HDS в России и странах СНГ, стратегия ILM нацелена на будущее, а Hitachi Data Systems ориентируется на конкретные практические решения.

В мае HDS анонсировала, как заявляют в компании, первые в отрасли сервис-ориентированные решения хранения (Services Oriented Storage Solutions, SOSS), позволяющие распределять ресурсы хранения в соответствии с требованиями бизнеса. В основе SOSS, ставшей развитием подхода AOS, — платформа Hitachi Universal Storage Platform V (компания поставила уже более 6000 интеллектуальных контроллеров хранения USP и NSC по всему миру) и новые разработки Hitachi Storage Software. Если ранее данные, функции и операции были ограничены жестко заданными структурами, и пользователям приходилось платить за незадействованные сервисы, то в SOSS, как утверждают в компании, сервисы хранения увязывают ресурсы и функции с потребностями бизнеса. Принципы SOA используются применительно к системам хранения.

USP V позволяет объединить в пул СХД разных производителей и реализует набор автоматизированных функций — сервисов хранения, обеспечивающих непрерывность бизнес-процессов, управление контентом (поиск и индексирование через Hitachi Content Archive Platform, HCAP), миграцию данных без прерывания работы, управление томами, динамическое точное выделение емкости хранения, защиту (неизменяемость данных, аудит), дедупликацию (с помощью Hitachi VTL), балансирование нагрузки, классификацию данных и управление файлами. Для управления используется ПО Hitachi Universal Volume Manager, Dynamic Provisioning и Virtual Partition Manager. Такая интеллектуальная архитектура нацелена на повышение гибкости бизнеса и создание бизнес-модели с оплатой за предоставляемые сервисы на основе используемых клиентами функций.

Концепция IBM «информация по требованию» также предусматривает предоставление нужных данных с помощью сервисов. Как отметил Алексей Сапожков, по сравнению с ILM архитектура SOA — более универсальная концепция с расширенной областью применения. Тем не менее, между этими подходами имеется определенное соответствие. В рамках SOA информация представляется в виде сервиса, и в основе этого процесса лежит понятие жизненного цикла. Предоставление информации в виде сервиса включает в себя и решения BI — наряду с интеграцией информации, управлением контентом, данными и сервисами баз данных.

Если у HP флагманской платформой ILM является RISS, то у HDS это HCAP, хотя производитель не позиционируют ее как продукт ILM. Анонсированная недавно система HCAP 2.0, решение архивирования с контентно-адресуемым хранением (Content Addressed Storage, CAS), способна поддерживать до 20 петабайт данных в системе из 80 узлов, обслуживающей до 32 млн объектов (файлов, метаданных и политик). HCAP 2.0 предлагает функции тиражирования объектов с развитыми возможностями настройки конфигурации и устранения копий хранимых данных, реализует средства шифрования, использует открытые интерфейсы и протоколы, включая NFS, CIFS и HTTP, а также стандарты управления SMI-S.

Рисунок 8. HDS SOSS — единая платформа для всех типов данных.
По словам Сергея Карпова, продвигаемый HDS сервис-ориентированный подход к хранению информации (см. Рисунок 8) перекликается
с идеями IBM, хотя последняя развивает принципы SOA на уровне приложений. HDS пока «единственный поставщик сервис-ориентированных систем хранения», но схожие подходы уже использует Symantec.

Основу предложений Symantec в области ILM составляют продукты Symantec Storage Foundation 5.0 и Dynamic Storage Tiering (DST). ПО DST использует файловую систему VxFS с единым пространством имен для хранения файлов. VxFS может занимать сразу несколько виртуальных томов, соответствующих разным уровням хранения. При этом достигается прозрачность реализации для пользователей, СУБД (DB2, Oracle и Sybase) и приложений, политик резервного копирования. Администратор управляет размещением файлов, задавал собственные правила на XML. В июне компания представила новую стратегию Storage United, которая должна связать воедино ПО защиты данных Symantec NetBackup, ПО управления хранением Storage Foundation и ПО архивирования Enterprise Vault. В результате заказчики получат общий набор услуг и единую консоль управления хранением на дисковых и ленточных системах, дедупликацией и Continuous Data Protection (CDP). Veritas NetBackup 6.5 — первый обновленный продукт, выпущенный в рамках этой инициативы.

Symantec Storage United — программно-ориентированный подход, позволяющий объединить разнородные платформы хранения в ЦОД и предлагать хранение данных как сервис. Ключевой элемент — ПО защиты данных, управления хранением и архивирование, поддерживающее основные системы хранения и серверы в ЦОД. Кроме средств управления сервисами хранения у Symantec имеются инструменты подготовки отчетов, упрощающие предоставление услуг хранения в соответствии с параметрами стоимости и SLA. Заказчики получают возможность выбора систем хранения данных и серверов.

Впрочем, реализация решений ILM обычно предполагает интеграцию оборудования и ПО разных вендоров. Как правило, ILM внедряется после того, как компания прошла «период первоначального накопления» данных/информации. Когда возникает потребность в упорядочивании информационных ресурсов, аппаратные и программные платформы уже работают, поэтому необходима интеграция оборудования и ПО в рамках ILM, считает Алексей Сапожков. IBM может предложить как отдельные компоненты, поддерживающие открытые стандарты, так целостные решения — типовые или созданные под конкретные условия.

По мнению Дмитрия Матчина, с точки зрения ILM не имеет значения, на оборудовании какого производителя будет построено решение: важны лишь параметры стоимости, быстродействия и совместимости систем. Кроме того, ведущие вендоры используют партнерские продукты. Например, в предлагаемой HP программе ILM DSPP участвуют десятки независимых разработчиков ПО. Программа предполагает его тестирование и сертификацию. Решения выбираются, исходя из требований политик хранения на основе характеристик оборудования и ПО, а c появлением таких стандартов, как XAM и SMI-S, тенденция независимости решения ILM от конкретного производителя будет нарастать.

Стандарт Extensible Access Method (XAM) может быть утвержден осенью. Он определяет интерфейс для приложений, позволяющий осуществлять независимую от производителя классификацию данных. ХАМ станет «связующим звеном» между разными приложениями и устройствами хранения, считают в HP, принимающей активное участие в разработке и использовании стандартов SMI-S и XAM под эгидой SNIA. Например, SMI-S применяется в HP Storage Essentials, обеспечивая управление ресурсами хранения в неоднородной среде SAN. Практика позволила выявить почти идентичные решения, и отрасль уже вплотную подошла к принятию стандартов ILM, считают в IDC. Пришло время объединения разрозненных знаний, технологий и методов.

ЗАКЛЮЧЕНИЕ

По данным IDC, сегодня в организациях создается и обрабатывается до 80% информации, и прежние методы ее хранения и защиты становятся все менее эффективными. Концепция ILM нацелена на тех, кто хочет навести порядок в информационной инфраструктуре, упорядочить процедуры сбора, хранения, поиска, защиты информации и ее уничтожения. Реализация проектов ILM требует сопоставления задач бизнеса с целым рядом технологий и подходов. Рынок перешел в более зрелую фазу, и нужны эффективные средства для того, чтобы находить нужную информацию. Потребность в этом сейчас остра, как никогда ранее. Однако современные методы управления данными все еще обгоняют понимание ситуации руководством российских компаний, полагает Дмитрий Матчин.

ILM предполагает изменение принципов организации информации, исходя из ее ценности, как определяющего параметра. А технологические решения призваны такие принципы реализовать. Значительные объемы информации и не всегда оптимальное их хранение и использование — объективная реальность для многих российских организаций. В этом плане продвижение передовых решений и технологий ILM в той или иной степени решает задачи просвещения рынка. Такие решения востребованы, в первую очередь, в его быстрорастущих сегментах — телекоммуникационном и банковском секторе. В них нуждаются государственные и корпоративные архивы, однако высокая стоимость внедрения ILM (для полномасштабных проектов она может составлять сотни тыс. долларов) препятствует более широкому использованию таких решений.

Кроме того, ставятся и более глобальные задачи: оперативное обеспечение требований бизнеса и необходимых уровней сервиса ИТ при одновременном снижении затрат, упрощение процессов управления информацией и ресурсами ИТ. Концепция, стратегия, продукты ILM будут постепенно становиться частью весьма масштабных подходов, основанных на автоматизации операций, виртуализации, предоставлении сервисов хранения. Совершенствование методов виртуализации СХД, рост плотности хранения данных, снижение стоимости позволяет реализовать новые модели, отвечающие разнообразным потребностям, а производители смещают акцент с инфраструктурных элементов на сервисы для бизнеса, решают практические задачи безопасности хранения информации, ее доступности и соответствия нормативным требованиям.

Сергей Орлов — обозреватель «Журнала сетевых решений/LAN». С ним можно связаться по адресу: sorlov@lanmag.ru


Ресурсы Internet

Предложения поставщиков СХД в области ILM.

HP — http://www.hp.co/go/ilm

EMC — http://www.emc.com/ilm

IBM — http://www.ibm.com/ru/services/gts/its/solutions/ilm

Fujitsu Siemens Computers — http://www.centricstor.com

Network Appliance — http://www-ru.netapp.com/solutions/infrastructure/archive-compliance

Sun Microsystems — http://www.sun.com/service/businesscompliance


Виртуализация в иерархии хранения

иерархии хранения для повышения эффективности работы с СХД, распределения ресурсов и управления ими может применяться виртуализация — на уровне файлов, блоков (SAN) или виртуальных магнитных лент (VTL). Ее ценность заключается в упрощении представления сложной физической структуры хранения, поясняют в IBM. С точки зрения НР виртуализация помогает обеспечить непрерывный доступ к информации, находящейся на различных (в том числе по классу) устройствах хранения, позволяет получить однородное представление всего корпоративного хранилища информации, а потому она повышает ценность внедрения ILM, обеспечивая прозрачность доступа к информации. При этом технические параметры конкретных устройств хранения начинают играть вспомогательную роль. По отчетам IDC, 49% компаний рассматривают возможности виртуализации СХД, и 34% заказчиков уже внедрили программную или аппаратную виртуализацию СХД. Как заявляют представители Sun, виртуализация — одно из средств организации многоуровневого хранения с единым управлением и доставкой сервисов.