«Большие Данные — раскрученная маркетологами тема, однако под ней лежит серьезная наука», — заявил Евгений Павловский, директор проекта «Исследовательские системы» НГУ, на конференции «Большие Данные в национальной экономике», организованной издательством «Открытые системы». В рамках программы состоялись выступления представителей ведущих российских школ анализа данных, а также нескольких организаций, применяющих анализ Больших Данных на практике. По мнению Павловского, ключевыми проблемами, стоящими перед научным сообществом, являются качество данных и их неструктурированность. Кроме того, возникает потребность в новых типах данных для представления текстовой информации и подходах к их анализу. Возможно, это потребует серьезного пересмотра алгоритмов добычи данных.

С научным фундаментом

Сергей Березин, руководитель совместного исследовательского центра Microsoft Research и МГУ, рассказал о проекте ChronoZoom по интерактивной визуализации мировой истории. Система размещается в облаках Windows Azure и представляет исторические события на двухмерной плоскости.

«С точки зрения открытой информации о людях социальные сети являются крупнейшим источником данных», — подчеркнул Михаил Комаров, руководитель департамента инноваций и бизнеса в ИТ факультета бизнес-информатики ВШЭ. Ключевая задача для многих компаний состоит в их мониторинге, причем польза от такой деятельности есть только в реальном времени. Более того, других способов получить актуальную информацию пока не существует. Эффективности предсказательной аналитики для этих целей пока явно недостаточно.

Как полагает Комаров, уже в ближайшее время на рынке будет крайне велика роль посредников, профессионально занимающихся извлечением из Больших Данных дополнительной ценности и предлагающих свои услуги. Компании постепенно приходят к архитектуре построения систем на основе модели «Данные как сервис» (Data as a Service).

«Интернет-ретейлерам доступна полная информация об аудитории, и практически все показатели можно и нужно измерять», — высказался Михаил Сливинский, руководитель отдела маркетинговой и поисковой аналитики компании «Викимарт». В этом состоит принципиальное отличие от традиционного ретейла, где количественные оценки зачастую невозможны. Критически важная задача онлайн-торговцев заключается в том, чтобы изучить потребности клиентов, персонализировать взаимодействие с ними и выстроить систему рекомендаций. Использование аналитики Больших Данных позволяет строить гораздо более умные системы, чем использование традиционных, более грубых подходов.

Форум, организованный в рамках деловой программы выставки Softool, прошел при поддержке Российского фонда фундаментальных исследований и Российской академии наук.