Теперь библиотеки nCluster содержат более 30 готовых к использованию пакетов для аналитики и свыше 1000 функций для работы с базами MapReduce, в том числе поиска заданных фрагментов текста и кластерного анализа данных. Технология MapReduce была разработана в компании Google и предназначена для организации баз с очень большими объемами данных. Одним из клиентов Aster Data является социальная сеть MySpace. Специалисты MySpace даже участвовали в создании технологий Aster. Сайту MySpace приходится обрабатывать порядка 6 млрд записей в базе в день, что составляет 2-3 Тбайт данных. По мере роста сети суточный объем обработки может вырасти до 10 Тбайт.
 

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF