IBM стремится уделять все больше внимания проблеме подготовки специалистов в области Больших Данных, о чем свидетельствует представленный на форуме образовательный интернет-ресурс
IBM стремится уделять все больше внимания проблеме подготовки специалистов в области Больших Данных, о чем свидетельствует представленный на форуме образовательный интернет-ресурс

Для широкого спектра продуктов IBM по управлению информацией на первый план выходит потребность современного бизнеса не просто справляться с обработкой колоссальных массивов накапливаемых данных, но извлекать из них реальную ценность для своей конкурентоспособности и развития. Поэтому ключевыми темами прошедшей в Лас-Вегасе конференции IBM Information on Demand были Большие Данные и бизнес-аналитика. Форум собрал более 10 тыс. участников и оказался самым масштабным мероприятием IBM в 2011 году.

Стив Миллз, старший вице-президент IBM Software&Systems Group, поделился несколькими цифрами. Утверждается, что 90% накопленных на сегодняшний день цифровых данных были созданы за последние два года, в ближайшее десятилетие их объем увеличится в 44 раза, и львиную долю (неизменные 80%) будут составлять неструктурированные данные: тексты, аудио, видео и т. п. Проблему усугубляет то, подчеркнул Миллз, что сегодня мы имеем дело не только с данными «в покое», но и во все большем количестве — с данными в динамике, которые поставляют различные сенсоры, системы мониторинга, RFID-устройства. Для них требуется анализ практически в реальном времени. В отстуствие эффективных инструментов работы с данными мы начинаем в них захлебываться — 60% участников традиционного международного опроса топ-менеджеров IBM CEO Study сообщили, что количество накапливаемой в организации информации превышает возможности ее использования. Но при этом четверо из пяти респондентов IBM считают информацию жизненно необходимым источником для достижения конкурентных преимуществ.

IBM претендует на приоритет в формулировке трех известных характеристик Больших Данных — volume, variety, velocity (объем, многообразие, скорость). Колоссальные объемы, разнообразие источников и типов, скорость поступления и обработки данных становятся повседневной реальностью для многих отраслей, от финансов и телекоммуникаций до ретейла и медицины. Потому IBM считает принципиальным органическое включение технологий Больших Данных в единую платформу управления информацией. Большие Данные не должны стать очередным технологическим «силосом» в организации. Чтобы этого не произошло, IBM реализует механизмы интеграции своих решений в области Больших Данных с другими компонентами платформы управления информацией. Эта платформа объединяет весь спектр решений IBM для работы с данными, от старейшей СУБД для мэйнфремов IMS, 12-я версия которой была анонсирована на конференции, от традиционных СУБД DB2 и Informix и хранилищ данных до средств управления контентом предприятия, управления мастер-данными и бизнес-аналитики. Ядром платформы являются механизмы интеграции и централизованного контроля данных Infosphere Information Server. Теперь система поддерживает и интеграцию с двумя основными продуктами, которые IBM предлагает для Больших Данных, — Infosphere BigInsights и Infosphere Streams.

BigInsights — решение на базе открытого фреймворка Apache Hadoop, добавляющее к нему инструменты, необходимые для управления данными в корпоративной среде, а также встроенные аналитические возможности, основанные на разработках IBM Researсh. Продукт Streams предназначен для анализа поступающих в реальном времени потоков структурированных и неструктурированных данных. На конференции были анонсированы новые версии решений Infosphere BigInsights 1.3 и Infosphere Streams 2.0, а также объявлено о доступности BigInsights в облачной среде IBM SmartCloud Enterprise. Как утверждают в корпорации, облачный вариант позволит получить работающую аналитическую функциональность BigInsights буквально за полчаса.

Средства работы с Большими Данными в облаке помогут расширить круг их пользователей, поскольку отпадает необходимость в квалифицированном владении такими сложными технологиями, как Hadoop. Однако в целом IBM стремится уделять все больше внимания проблеме подготовки специалистов в этой области, о чем свидетельствует представленный на форуме образовательный интернет-ресурс BigDataUniversity.com с разнообразными учебными материалами по Hadoop, BigInsights, технологиям управления базами данных и разработки с открытым кодом. Многие из них находятся в свободном доступе. В интернет-университете уже зарегистрировалось более 8 тыс.студентов из различных стран, в том числе из России.

Что касается традиционного аналитического инструментария IBM, то на конференции была анонсирована поддержка планшетов iPad в мобильной версии IBM Cognos Mobile, а также новые возможности системы прогнозной аналитики SPSS Statistics 20, которая теперь позволяет учитывать географическое местоположение при анализе и моделировании. Это поможет в решении таких задач, как планирование маркетинговых кампаний, выбор наиболее удобных точек для новых магазинов, борьба с преступностью в определенных районах и т. д. В IBM подчеркивают также, что ее системы работы с Большими Данными помимо встроенной аналитики имеют возможность интеграции с решениями Cognos и SPSS.