apache

Поиск, мониторинг и анализ в социальных сетях

Социальные сети — это ежедневно растущие петабайтные объемы неструктурированных данных, сбор, хранение и обработка которых традиционными средствами затруднительны. Технологии стека Hadoop позволяют решать эти задачи, однако реализация проектов не всегда оказывается безболезненной.

Новые инструменты Hadoop

За последние годы экосистема Hadoop претерпела существенные структурные изменения, обретая черты полнофункциональной системы для горизонтально масштабируемой обработки данных, работающей с интерактивными и поточными нагрузками. Заметную роль в этом изменении сыграли проекты Spark, Storm и Tez.