Институт системного программирования РАН представил две разработки, предназначенные для анализа больших массивов данных социальных сетей. «Текстерра» — технология многоязычного интеллектуального анализа текста. В ее основе — программный комплекс, способный накапливать и анализировать информацию, устанавливать взаимосвязь между понятиями и проводить интеллектуальный анализ текстов. В результате при использовании этой технологии возможно вычислять лексически сходные тексты, принадлежащие перу одного автора или написанные по единому плану, содержащие сходные семантические конструкции, выявлять факт и структуру информационных «вбросов». Система «Талисман» позволяет отследить и выявить фиктивные аккаунты, служащие для распространения недостоверной информации, спама, имитации массовой активности — ботов. Анализ производится по полным и неполным данным, указанным в профилях социальных сетей, социальным связям аккаунтов, подпискам, спискам друзей и читателей.

Купить номер с этой статьей в PDF