Платформа Greenplum Unified Analytics Platform объединяет в себе средства для работы как со структурированными, так и с неструктурированными данными. Источник: Greenplum
Платформа Greenplum Unified Analytics Platform объединяет в себе средства для работы как со структурированными, так и с неструктурированными данными. Источник: Greenplum

Выпуск этой платформы, которая станет удобным инструментом изучения корпоративной информации для пользователей из самых разных отраслей, намечен на первый квартал 2012 года.

Платформа объединит в себе СУБД EMC Greenplum, семейство продуктов для анализа неструктурированных данных EMC Greenplum HD на базе аналитического фреймворка с открытым кодом Hadoop и пользовательский интерфейс EMC Greenplum Chorus 2.0 для формирования запросов и визуализации данных. В своей новой версии он позволяет обращаться как к структурированным, так и к неструктурированным данным.

Аналитик Enterprise Strategy Group Джули Локнер отмечает, что объемы данных, накопленных организациями, становятся слишком велики для обработки традиционными средствами. Проблему представляют собственно объемы данных, сложность запросов, а также нередко невозможность получить быстрый ответ.

По словам Локнер, некоторые предприятия, особенно в сфере розничной торговли и в здравоохранении, применяют технологии, подобные той, над которой работает Greenplum. Это позволяет им получить больше полезной информации из данных, которыми они уже располагают. Так, например, онлайн-магазины могут устанавливать корреляцию поведения посетителей с последующими покупками, а фармацевтическим компаниям проще обрабатывать результаты клинических исследований. Новые аналитические инструменты все шире применяют страховые и инвестиционные компании для повышения точности своих прогнозов.

Greenplum ставит перед собой задачу, в частности, предложить аналитические инструменты, которыми могли бы пользоваться руководители компании и их сотрудники, а не только небольшая группа специалистов в области анализа данных. В понятном интерфейсе Chorus запросы, сформулированные привычным для человека способом, преобразуются в запросы к наборам данных. Он также включает в себя среду социальной сети, в которой сотрудники одной организации могут совместно работать с данными.

По словам Майкла Мэкси, старшего директора Greenplum по маркетингу продуктов, UAP даст корпоративным пользователям два основных преимущества.

«Прежде всего, речь идет о масштабе данных, к которым можно обращаться, но помимо этого появляется возможность работать с существующими процессами и методами и применять их к новым наборам данных», — пояснил Мэкси.

Помимо доступа к неструктурированным данным с помощью Greenplum HD, в Chorus 2.0 реализована возможность быстро создавать виртуальную «песочницу» для разработки новых аналитических процессов. Эта функция реализована на базе технологии VMware, являющейся подразделением EMC.

Источник: Greenplum

Источник: Greenplum

UAP можно развернуть на том стандартном оборудовании, которым предприятие уже располагает, либо заказать сконфигурированный комплект. Предприятия, уже использующие СУБД Greenplum или Greenplum HD, могут интегрировать их в объединенную платформу.

Анализ данных в традиционных СУБД производится с использованием технологий, отличающихся от технологий анализа неструктурированных данных, таких, как веб-страницы, изображения и видео. Бизнес-подразделения в своих запросах не разделяют эти типы информации, поэтому в идеале предприятия должны иметь две аналитические платформы, в то время как подавляющее большинство может позволить себе только одну, подчеркнула Локнер. Платформа UAP представляет собой экономичное решение для получения ответов на запросы к обоим типам данных.

ИТ-специалисты, имеющие необходимую подготовку для создания таких запросов, стремятся сохранить свое влияние в компании, в их интересах — хранение корпоративных данных в границах сетевого экрана, что может быть важно для гарантии выполнения нормативных требований к управлению данными. UAP может помочь добиться этого в тех случаях, когда руководителям бизнес-подразделений, например, потребуется новый тип отчета.

«Не нужно каждый раз мучительно решать, к кому из многочисленных производителей обращаться и что делать, информационные потребности бизнеса полностью удовлетворяются собственным ИТ-подразделением, и нет необходимости пользоваться услугами хранения и обработки данных в облаке, — отметила Локнер. — Это реальная альтернатива всем облачным сервисам и поставщикам программного обеспечения как сервиса».

Компании-стартапы, специализирующиеся на визуализации данных, такие как Tableau и Alpine Miner, уже сейчас предлагают понятные интерфейсы для анализа данных, подобные Chorus 2.0, но если рассматривать возможности UAP в целом, то можно, по словам Локнер, говорить о принципиально новом продукте. По существу, диапазон и скорость новых инструментов настолько кардинально изменяют «правила игры» в деле аналитики, что специалистам в этой области требуется в корне изменить свои представления о том, как исследовать данные предприятий.

«Есть лишь немного специалистов, взгляды которых на то, как повысить эффективность платформ анализа данных и что в принципе представляет собой анализ данных, отличаются от тех, которым учат в колледжах», — заметила Локнер. Возможность анализировать все данные, которыми располагает организация, или создавать модели данных за считанные дни вместо месяцев существенно изменяет представления, сложившиеся в сфере аналитики.

В подтверждение этих слов Greenplum анонсировала программу Big Data & Analytics Training Program, которую планируется преподавать более чем в 700 колледжах и университетах США.