Теперь библиотеки nCluster содержат более 30 готовых к использованию пакетов для аналитики и свыше тысячи функций для работы с базами MapReduce, в том числе поиска заданных фрагментов текста и кластерного анализа данных. Технология MapReduce была разработана в компании Google и предназначена для организации баз с очень большими объемами данных. Традиционные корпоративные базы данных строятся на основе реляционных технологий и поддерживают язык запросов SQL. Разработчики Aster Data пытаются объединить преимущества обеих технологий в библиотеках SQL-MapReduce, позволяющих использовать запросы на SQL при работе с базами данных на платформе MapReduce. Одним из клиентов Aster Data является социальная сеть MySpace. Специалисты MySpace даже участвовали в создании технологий Aster. Сайту MySpace приходится обрабатывать порядка 6 млрд записей в базе в день, что составляет 2-3 Тбайт данных. По мере роста сети суточный объем обработки может вырасти до 10 Тбайт.
 

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF