Анализ онлайн-активности человека способен указать на вероятность наличия у него онкологического заболевания, показывают научные сотрудники Microsoft Research в опубликованном недавно докладе.

Исследователи объявили, что по результатам обработки истории поисковых запросов им удавалось выявлять людей, болеющих раком поджелудочной железы, еще до того, как тем поставили диагноз.

Как пишут авторы, результаты исследования указывают на возможность создания «недорогих систем наблюдения с широким охватом» для пассивного мониторинга поисковой активности и заблаговременной выдачи предостережений о вероятности рака поджелудочной железы, а также, после расширения разработанной методологии, и других опасных видов рака, пишут авторы.

В исследовании использовалась база из 9,2 млн запросов к поисковой системе Bing, поступивших от англоязычных американцев за период с октября 2013-го по май 2015 года. Для построения статистической модели применялись не только сами запросы, но и данные переходов по ссылкам, позволившие уточнять намерения пользователей.

Участники исследовательской группы, в которую вошли научные сотрудники Microsoft Research Эрик Хорвитц и Райен Вайт, а также сотрудник Колумбийского университета Джон Папарризос, сообщили, что данные были анонимизированы, но каждому поисковому запросу был присвоен идентификатор, привязывающий его к конкретному браузеру, чтобы можно было прослеживать индивидуальную историю поиска.

Протоколы поисковых запросов, посвященных раку поджелудочной железы. Исследователи из Microsoft показали, что могут идентифицировать от 5% до 15% пользователей, у которых диагностировали это заболевание, на основании истории их предыдущих поисковых запросов

Вначале, по словам авторов, были выявлены пользователи, делавшие запросы, которые указывали на недавнюю постановку диагноза «рак поджелудочной железы». К таким запросам, например, относились фразы «причины развития рака поджелудочной» и «к чему готовиться, если ди­агностировали рак поджелудочной».

С помощью специальным образом настроенных фильтров Bing исследователи отсеяли запросы со специальной лексикой, указывавшей на то, что их делали профессиональные медики. В результате для изучения осталось около 7,2 млн запросов от людей, у которых предположительно диагностировали заболевание.

Затем исследователи проанализировали запросы о симптомах, совершавшиеся теми же пользователями на несколько месяцев раньше.

«Мы убедились, что можем идентифицировать рак в 5–15% случаев при очень низком количестве ложно-положительных результатов», — пишут исследователи. По их словам, уровень таких результатов составлял от одного на 100 тыс. до одного на 10 тыс.

В отличие от многих других видов злокачественных опухолей, которые могут расти медленно, рак поджелудочной железы — один из самых агрессивных, поэтому в его случае более ранняя диагностика улучшает шансы больного.

Ранние признаки рака поджелудочной железы малозаметны и нередко проявляются в форме неспеци­фичных симптомов, меняющихся со временем, отмечают исследователи.

Результаты анализа поисковых запросов указывают на возможность раннего обнаружения заболевания — до пяти месяцев перед официальной постановкой диагноза.