Высокое быстродействие системы обеспечивается за счет разработанной в Greenplum технологии массово-параллельной обработки. Как утверждают в EMC, кластер способен загружать данные вдвое быстрее, чем конкурентные продукты, такие как Teradata, Oracle Exadata и IBM Netezza.

Как объясняют в EMC, большинство специализированных систем хранилищ данных имеют один головной узел, через который должны проходить все загружаемые данные. При импорте большого объема данных за короткое время пропускная способность такой системы может упасть. Кластер Greenplum загружает информацию в параллельном режиме на все серверы, для чего каждый из них имеет свое Ethernet-соединение. Данная архитектура также позволяет ускорить анализ данных за счет распределения обработки каждого запроса между серверами.

На серверы Greenplum Data Computing Appliance предустановлена СУБД Greenplum Database 4.0. В состав комплекса также входят накопители и сетевое оборудование. В каждой стойке смонтировано по 16 серверов, имеющих по два шестиядерных процессора Intel E5670. Стойка вмещает до 36 Тбайт данных, а 24-стоечная система может хранить в режиме компресии до 5 Пбайт.

С выпуском кластера в EMC создали новое подразделение Data Computing Products Division, которое будет специализироваться в области ПО управления данными.

Поделитесь материалом с коллегами и друзьями