В рамках программы состоялись выступления представителей ведущих российских школ анализа данных, а также нескольких организаций, применяющих анализ Больших Данных на практике. Форум стал дискуссионной площадкой для обсуждения исследовательскими коллективами перспективных проектов из области работы с данными.

По мнению Павловского, ключевыми проблемами, стоящими перед научным сообществом, являются качество данных и их неструктурированность. Когда речь идет об анализе данных, то часто подразумевается, что они уже собраны и релевантны решаемым задачам. Однако помимо низкого качества часто наблюдается еще и несоответствие целей сбора данных целям дальнейших исследований. Кроме того, возникает потребность в новых типах данных для представления текстовой информации и подходах к их анализу. Возможно, это потребует серьезного пересмотра алгоритмов добычи данных.

Евгений Павловский
Евгений Павловский: «Большие Данные – раскрученная маркетологами тема, однако под ней лежит серьезная наука»

«Путь ИТ в бизнес всегда был непрост. Во многом причина заключается в том, что технологии развиваются гораздо быстрее, чем менеджмент, а потому становятся востребованными не сразу», — отметила Светлана Мальцева, декан факультета бизнес-информатики ВШЭ. Пожалуй, к Большим Данным это относится еще больше, чем к остальным технологиям: помимо «перестройки мозгов» менеджмента (нужно будет доверять не только данным, но и результатам их обработки), требуется еще и подготовка специалистов, огромный дефицит которых наблюдается во всем мире.

В ВШЭ в текущем году стартовала программа «Системы Больших Данных», посвященная применению технологий Больших Данных в бизнесе. Эта дисциплина находится на стыке ИТ, науки о данных (Data Science) и бизнес-знаний. Она фокусируется не столько на анализе данных, сколько на интерпретации его результатов и предполагает новый подход.

По мнению Мальцевой, существует пять ступеней информационной зрелости компаний. Большинство компаний находятся на первых трех – мониторинг бизнеса, анализ бизнеса и оптимизация бизнеса. Две оставшихся ступени – монетизацию данных и трансформацию бизнеса – им еще предстоит покорить. Монетизация данных – важнейший этап, когда данные становятся реальным активом предприятия, во многом психологическим рубежом, преодоление которого позволяет вывести работу с данными на новый уровень — например, компания может предоставлять аналитические услуги внешним потребителям.

Сергей Березин, руководитель совместного исследовательского центра Microsoft Research и МГУ, рассказал о проекте ChronoZoom по интерактивной визуализации мировой истории. Система размещается в облаках Windows Azure и представляет исторические события на двухмерной плоскости. Она активно используется в образовательных программах США как инструмент для публикации научных гипотез и исследований, а также обнаружения интересных фактов и закономерностей в исторических событиях.

«С точки зрения открытой информации о людях социальные сети являются крупнейшим источником данных», — подчеркнул Михаил Комаров, руководитель департамента инноваций и бизнеса в ИТ факультета бизнес-информатики ВШЭ. Ключевая задача для многих компаний состоит в их мониторинге, причем польза от такой деятельности есть только в реальном времени. Более того, других способов получить актуальную информацию пока не существует. Эффективности предсказательной аналитики для этих целей пока явно недостаточно.

Развитие мобильного Интернета породило множество услуг: мобильная реклама, мобильные платежи, геолокационные сервисы, мобильные игры и видео. Мобильные устройства формируют портрет своего хозяина и сильно помогают в оказании ему персонифицированных услуг. Они круглосуточно включены и отправляют операторам связи массу ценной информации. Мобильные устройства — пока единственная массово работающая технология в рамках Интернета вещей, остающаяся на сегодняшний день основным источником Больших Данных для анализа, причем наибольший объем данных предоставляют сами пользователи.

Как полагает Комаров, уже в ближайшее время на рынке будет крайне велика роль посредников, профессионально занимающихся извлечением из Больших Данных дополнительной ценности и предлагающих свои услуги. Компании постепенно приходят к архитектуре построения систем на основе модели «Данные как сервис» (Data as a Service).

«Интернет-ретейлерам доступна полная информация об аудитории, и практически все показатели можно и нужно измерять», — высказался Михаил Сливинский, руководитель отдела маркетинговой и поисковой аналитики компании «Викимарт». В этом состоит принципиальное отличие от традиционного ретейла, где количественные оценки зачастую невозможны. При этом стоимость любой ошибки весьма высока – конкуренты находятся друг от друга на расстоянии одного клика мышью.

Критически важная задача онлайн-торговцев заключается в том, чтобы изучить потребности клиентов, персонализировать взаимодействие с ними и выстроить систему рекомендаций. Использование аналитики Больших Данных позволяет строить гораздо более умные системы, чем использование традиционных, более грубых подходов.

Форум, организованный в рамках деловой программы выставки SofTool, прошел при поддержке Российского фонда фундаментальных исследований и Российской академии наук.