Кластерная СУБД Hadoop способна хранить не только данные, предназначенные для анализа в системе MapReduce, считают в компании Cloudera. Некоторые из клиентов компании начали использовать платформу Hadoop в качестве центрального хранилища данных, и это, как полагают в Cloudera, чрезвычайно важная тенденция. В очередной бета-версии разрабатываемого в компании коммерческого дистрибутива Cloudera Enterprise 5 реализованы новые инструменты, помогающие Hadoop взять на себя хранение всех корпоративных данных. Разработчики версии Apache Hadoop 2 с открытым кодом, на которой основан Cloudera Enterprise, добавили в него менеджер ресурсов YARN, позволяющий работать с разными аналитическими приложениями, а не только с теми, которые используют пакетные процессы MapReduce. В компании Cloudera тоже создали платформу для подключения сторонних аналитических приложений. Ее поддерживают некоторые программы SAS, Revolution Analytics, Syncsort и других разработчиков.

В Cloudera Enterprise 5 реализована также буферизация данных файловой системы HDFS в рабочей памяти сервера, что должно ускорять выполнение запросов. Cloudera Navigator, первоначально служивший для аудита безопасности данных, теперь стал полностью интегрированным инструментом управления данными.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF