ПЛАТФОРМА GREENPLUM Unified Analytics Platform объединяет в себе средства для работы как со структурированными, так и с неструктурированными данными
ПЛАТФОРМА GREENPLUM Unified Analytics Platform объединяет в себе средства для работы как со структурированными, так и с неструктурированными данными
Источник: Greenplum

В 2010 году EMC приобрела компанию Greenplum, которая стала одним из ее подразделений. Теперь Greenplum подготовила к выпуску единую аналитическую платформу Unified Analytics Platform (UAP), объединяющую в себе средства для работы как со структурированными, так и с неструктурированными данными. Выпуск этой платформы, которая станет удобным инструментом изучения корпоративной информации для пользователей из самых разных отраслей, намечен на первый квартал 2012 года.

Платформа объединит в себе СУБД EMC Greenplum, семейство продуктов для анализа неструктурированных данных EMC Greenplum HD на базе аналитического фреймворка с открытым кодом Hadoop и пользовательский интерфейс EMC Greenplum Chorus 2.0 для формирования запросов и визуализации данных.

В своей новой версии платформа позволяет обращаться как к структурированным, так и к неструктурированным данным.

Аналитик Enterprise Strategy Group Джули Локнер отмечает, что объемы данных, накопленных организациями, становятся слишком велики для обработки традиционными средствами. Проблему представляют собственно объемы данных, сложность запросов, а также нередко невозможность получить быстрый ответ.

По словам Локнер, некоторые предприятия, особенно в сфере розничной торговли и в здравоохранении, применяют технологии, подобные той, над которой работает Greenplum. Это позволяет им получить больше полезной информации из данных, которыми они уже располагают.

Так, например, онлайн-магазины могут устанавливать корреляцию поведения посетителей с последующими покупками, а фармацевтическим компаниям проще обрабатывать результаты клинических исследований. Новые аналитические инструменты все шире применяют страховые и инвестиционные компании для повышения точности своих прогнозов.

Greenplum ставит перед собой задачу, в частности, предложить аналитические инструменты, которыми могли бы пользоваться руководители компании и их сотрудники, а не только небольшая группа специалистов в области анализа данных. В понятном интерфейсе Chorus запросы, сформулированные привычным для человека способом, преобразуются в запросы к наборам данных. Он также включает в себя среду социальной сети, в которой сотрудники одной организации могут совместно работать с данными.

По словам Майкла Мэкси, старшего директора Greenplum по маркетингу продуктов, UAP даст корпоративным пользователям два основных преимущества.

«Прежде всего, речь идет о масштабе данных, к которым можно обращаться, но кроме этого появляется возможность работать с существующими процессами и методами и применять их к новым наборам данных», — пояснил Мэкси.

Помимо доступа к неструктурированным данным с помощью Greenplum HD, в Chorus 2.0 реализована возможность быстро создавать виртуальную «песочницу» для разработки новых аналитических процессов. Эта функция реализована на базе технологии VMware, являющейся подразделением EMC.

UAP можно развернуть на том стандартном оборудовании, которым предприятие уже располагает, либо заказать сконфигурированный комплект. Предприятия, уже использующие СУБД Greenplum или Greenplum HD, могут интегрировать их в объединенную платформу.

Анализ данных в традиционных СУБД производится с использованием технологий, отличающихся от технологий анализа неструктурированных данных, таких как веб-страницы, изображения и видео.

Бизнес-подразделения в своих запросах не разделяют эти типы информации, поэтому в идеале предприятия должны иметь две аналитические платформы, в то время как подавляющее большинство может позволить себе только одну, подчеркнула Локнер.

Платформа UAP представляет собой экономичное решение для получения ответов на запросы к обоим типам данных.

«Не нужно каждый раз мучительно решать, к кому из многочисленных производителей обращаться и что делать, информационные потребности бизнеса полностью удовлетворяются собственным ИТ-подразделением, и нет необходимости пользоваться услугами хранения и обработки данных в облаке, — отметила Локнер. — Это реальная альтернатива всем облачным сервисам и поставщикам программного обеспечения как сервиса».