Дмитрий Лактионов: «Внедрений системы Content Analytics в России пока нет, но интерес значительный»
Дмитрий Лактионов: «Внедрений системы Content Analytics в России пока нет, но интерес значительный»

Внедрений системы в России пока нет, но интерес значительный, как отметил на презентации Дмитрий Лактионов, руководитель направления по развитию управления информационными ресурсами предприятия IBM в России и СНГ, тем более после громкого успеха «интеллектуального» суперкомпьютера Watson, в основе работы которого как раз и лежит ПО Content Analytics.

По словам Лактионова, сегодня широко признается важность поиска эффективных механизмов анализа неструктурированных данных, объемы которых во всей совокупности накапливаемой цифровой информации значительно превышают объемы структурированных. Чтобы решить эту задачу, необходимо построить мост между естественным языком и языком компьютера, трансформировать сложные высказывания в четкие понятия и сущности, которые способна понять и проанализировать машина.

Анализ больших объемов текстовых документов на базе специальных механизмов, задаваемых специалистами, довольно давно реализован IBM в системе OmniFind. Решение Content Analytics идет дальше, предлагая возможность поиска и анализа неструктурированной текстовой информации простыми способами, доступными широкому кругу пользователей. В основе системы лежит механизм текстовой аналитики, вычленяющий в текстах заданные понятия и определенные типы информации для последующего анализа. Как поясняют в IBM, продукт Content Analytics может применяться для выявления тенденций, типовых моделей поведения, статистических взаимосвязей, обеспечивая быструю и эффективную обработку очень больших объемов документов, записей в блогах и форумах, преобразованных в текст аудиозаписей и т. д. Среди примеров использования системы – анализ обращений по качеству медицинского обслуживания в США, повлекший за собой штрафные санкции в отношении одного из производителей медицинского оборудования; повышение качества работы контактного центра крупного оператора на основе анализа обращений абонентов. В российской лаборатории систем и технологий IBM с помощью Content Analytics разрабатывается решение для анализа информации по университетам США с целью оптимизации распределения научных грантов.

Для продвижения на российский рынок в продукте локализованы базовые аспекты поддержки языка. Применение системы в конкретных отраслях требует ее настройки на специфику той или иной индустрии или научной области, для чего в Content Analytics предусмотрен специальный механизм, который может использовать либо сам заказчик, либо партнер IBM, осуществляющий внедрение.