Cloudera делает ставку на перспективные подходы к управлению базами данных и намерена предлагать их корпоративным клиентам в качестве альтернативы реляционным СУБД. Hadoop базируется на технологии Google MapReduce, предназначенной для организации параллельной обработки данных на большом количестве компьютеров массовых конфигураций. Дистрибутив Hadoop и новый инструментарий в Cloudera адресуют организациям небольшого размера. Cloudera Distribution for Hadoop (CDH) включает в себя набор программ с открытым кодом: программное обеспечение Hive, формирующее инфраструктуру для построения хранилищ данных; СУБД Hbase на основе Hadoop; компилятор Pig для программ, соответствующих парадигме map-reduce; планировщик Zookeper для запуска приложений на нескольких серверах; технологию MapReduce. В новую, третью версию пакета также включены три программы, выпущенные Cloudera по лицензии Apache V2. Программный инструментарий Flume помогает загружать данные в среду Hadoop, Oozie предназначено для управления потоками работ, Hadoop User Environment реализует пользовательский интерфейс для управления Hadoop. CDH 3.0 в пакете Cloudera Enterprise дополняют основанные на протоколе LDAP инструменты управления, распространяемые на коммерческих условиях и предназначенные для управления доступом, распределения ресурсов, настройки конфигурации и мониторинга производительности.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF