Кластерная СУБД Hadoop способна хранить не только данные, предназначенные для анализа в системе MapReduce, считают в компании Cloudera. Некоторые из клиентов компании начали использовать платформу Hadoop в качестве центрального хранилища данных, и это, как полагают в Cloudera, чрезвычайно важная тенденция. В очередной бета-версии разрабатываемого в компании коммерческого дистрибутива Cloudera Enterprise 5 реализованы новые инструменты, помогающие Hadoop взять на себя хранение всех корпоративных данных. Разработчики версии Apache Hadoop 2 с открытым кодом, на которой основан Cloudera Enterprise, добавили в него менеджер ресурсов YARN, позволяющий работать с разными аналитическими приложениями, а не только с теми, которые используют пакетные процессы MapReduce. В Cloudera Enterprise 5 реализована также буферизация данных файловой системы HDFS в рабочей памяти сервера, что должно ускорять выполнение запросов.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF