Yahoo использует искусственный интеллект новой системы для того, чтобы повысить кликабельность первой страницы

По словам представителей Yahoo, на протяжении последних месяцев в компании идут испытания системы, предназначенной для определения самого трудно выявляемого свойства новостной статьи – интересна она или нет.

Редакторам пора на покой?

Старший научный сотрудник компании Yahoo Дипак Агарвал входит в десятку специалистов, которые уже несколько месяцев стараются выяснить, удастся ли с помощью алгоритмов с искусственным интеллектом повысить трафик модуля Yahoo Today – той части заглавной страницы сайта Yahoo, где печатаются главные новости дня.

В компании новая система получила аббревиатуру COKE - Content Optimization Knowledge Engine, то есть “система оптимизации контента на основе знаний”, а ее авторы в шутку решили называть себя “кокаинщиками” (Cokeheads).

"Редакторы Yahoo и так обладают хорошим чутьем на интересные новости, и убедить людей, отвечающих за содержание заглавной страницы, в том, что машине можно доверить размещение новостей, было непростой задачей, - сказал Агарвал, выступая на конференции New Paradigms in Using Computers в исследовательском центре IBM в Альмадене. - Редакторы работали над этим многие годы. Нелегко было убедить их в том, что система может оказаться им полезной”.

Но исследователям удалось продемонстрировать, как именно система поможет редакторам понять, что происходит на Web-сайте. Они создали для них информационную панель, на которой мгновенно отображается степень популярности отдельно взятой статьи среди различных групп читателей – например, молодежи или людей 45-50 лет.

Вопреки традициям

Решение проблемы интереса к статье потребовало выхода за пределы традиционных подходов к отбору новостей, основанных на факторах возраста, пола, места жительства читателя и ключевых слов в тексте статьи. “Мы пытались персонализировать информацию, сортировали по возрасту и полу, но ничего не вышло”, - пояснил Агарвал.

Дело в том, что такой подход не учитывает другие факторы – например, то, что в разное время дня люди чаще щелкают по разным типам статей.

Поэтому исследователи создали модель со множеством факторов, способную почти в реальном времени отслеживать популярность различных статей. “Нам пришлось построить динамическую модель”, - говорит Агарвал.

Самое трудное, пояснил он, - обеспечить достаточно быстрый сбор и обработку данных. Ведь в современном мире интерес к новости пропадает уже через шесть часов после ее появления. Важно было, кроме того, создать систему, способную работать даже при увеличении трафика.

Пока еще неясно, когда COKE выйдет из стен лаборатории (и выйдет ли вообще), но предварительные результаты многообещающие. "Система COKE позволила увеличить коэффициенты отклика (click rate) на 25-30%, - заявил Агарвал. - А это в год даст прирост дохода в миллионы долларов".