Потребность многих компаний в извлечении полезных для бизнеса сведений из протоколов Web-серверов и социальных медиа обусловливает рост интереса к технологии управления данными с открытым кодом Hadoop. Она способна обрабатывать тера- и даже петабайты неструктурированных и структурированных данных путем разбиения больших задач на фрагменты, которые для ускорения обработки распределяются по узлам кластеров, построенных на базе стандартного оборудования. Hadoop используется онлайн-гигантами – сайтами Facebook, eBay, Amazon и Yahoo – и в последнее время все активнее внедряется банками, рекламными, биотехнологическими и фармацевтическими компаниями, утверждает аналитик RedMonk Стивен О’Грэди. В компании Tynt Multimedia, специализирующейся в области Web-аналитики, перешли на Hadoop около полутора лет тому назад, когда ежедневный объем обрабатываемых данных вырос до терабайта и MySQL перестала справляться с нагрузкой. В Tynt отмечают, что Hadoop намного быстрее, чем реляционные СУБД, позволяет загружать новые данные в базу.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF