Hadoop

Масштабируемое хранилище журналов

Объемы данных, которые вынуждены сегодня накапливать компании, постоянно растут, что порождает проблему их оптимального хранения. Значительную часть этих объемов составляют разнообразные учетные журналы, которые часто вообще не используются, хотя и могут оказаться полезными в будущем. Как с помощью Apache Hadoop обеспечить эффективное хранение журналов с целью их последующей обработки?

Новые инструменты Hadoop

За последние годы экосистема Hadoop претерпела существенные структурные изменения, обретая черты полнофункциональной системы для горизонтально масштабируемой обработки данных, работающей с интерактивными и поточными нагрузками. Заметную роль в этом изменении сыграли проекты Spark, Storm и Tez.

Большие Данные и суперкомпьютеры

Аналитика Больших Данных требует применения высокопроизводительных систем, однако на пути конвергенции этих двух миров имеется ряд препятствий. Как решать проблему Больших Данных на суперкомпьютерах?

Альтернативы MapReduce для реального времени

Вызвавшая в свое время фурор модель распределенных вычислений MapReduce уже успела морально устареть — производительности, обеспечиваемой данной моделью, для аналитики Больших Данных уже недостаточно.