После почти семи лет разработки и оптимизации кластерная платформа анализа данных Apache Hadoop выпущена в версии 1.0, полностью готовой к рабочему применению, — об этом объявила проектная команда Hadoop. Номер 1.0 новой версии решено было присвоить прежде всего благодаря трем особенностям. Первая — это сквозная безопасность. По утверждению разработчиков Hadoop, платформу теперь можно защитить по всей сети с помощью протокола аутентификации Kerberos. Второе новшество — API webhdfs, с помощью которого с Hadoop можно взаимодействовать по широко используемому протоколу REST. Третья особенность состоит в том, что Hadoop теперь полностью поддерживает СУБД HBase, благодаря чему данные для платформы можно хранить в виде привычной многим структуры, напоминающей реляционные таблицы.

Изначально Hadoop была создана в 2005 году как реализация алгоритма распределенной обработки данных Google MapReduce. Сегодня Hadoop широко используется для обработки наборов данных, слишком больших для реляционных баз. Технология пользуется поддержкой многих коммерческих компаний. Например, корпорация IBM включила Hadoop в решение для анализа данных InfoSphere BigInsights, а Microsoft исполняет копию Hadoop в своем облачном сервисе Azure.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF