Как утверждают в компании Google, созданная ими система MapReduce способна отсортировать терабайт данных за 68 секунд. Это почти в три раза лучше результата, показанного в июле системой Apache Hadoop компании Yahoo. В то же время, в работе MapReduce была параллельно задействована тысяча серверов, а Yahoo использовала 910. В другом испытании MapReduce участвовало 4000 серверов, а объем сортируемых данных достиг одного петабайта (1000 терабайт). Система справилась с сортировкой за 6 часов 2 минуты.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF