Желающие протестировать Hadoop, но не имеющие свободного кластера для этого, могут попробовать платформу обработки данных на офисном компьютере благодаря системе Sandbox, выпущенной компанией Hortonworks. Это одноузловая реализация Hadoop, основанная на дистрибутиве Hortonworks Data Platform. Упакованная в виртуальную машину, она включает в себя все стандартные компоненты среды Hadoop, в том числе подсистему управления хранением HCatalog, хранилище данных Hive и набор аналитических инструментов Pig.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF