Автоматические системы Google ежедневно обходят назначенные участки Web, индексируют их содержимое и обновляют данные в общей базе. Этот процесс занимал не меньше недели, и не все центры обработки данных Google получали новые данные одновременно. Поэтому поиск мог выдавать разные результаты в зависимости от того, какой из центров обрабатывал запрос. Caffeine позволяет обновлять индекс непрерывно, и результаты сразу отображаются в поиске. Кроме того, Caffeine намного увеличивает возможности масштабирования. Google теперь сможет индексировать порядка 100 петабайт документов, утверждают в компании, и новая информация добавляется в систему со скоростью нескольких сот тысяч гигабайтов в сутки.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF