В прошедшем году система «Поиск@Mail.ru» стала самой быстрорастущей на рынке поиска
В прошедшем году система «Поиск@Mail.ru» стала самой быстрорастущей на российском рынке поиска

За прошедший год система «Поиск@Mail.ru» стала самой быстрорастущей на рынке поиска. Сейчас ее доля оценивается в 9,4% российского рынка поисковых запросов, по данным портала li.ru. Причем в своей работе «Поиск@Mail.ru» использует две базы: собственную и Google — «отечественные» запросы она обрабатывает сама, а иностранные — посредством Google.

На сегодня в поисковом индексе Mail.ru находится 6-7 млрд уникальных адресов. Индекс машины построен на базе системы хранения Hadoop, и разработчики Mail.ru активно участвуют в развитии этого продукта. Особенностью «Поиск@Mail.ru» является обработка сложных запросов. В машине нет собственного языка для их составления, и поэтому она пытается подбрать документы, где слова из запроса стоят как можно ближе друг к другу. Однако есть специальные слова, появление которых в запросе подсказывает машине особый сценарий поиска. Например, слово «цена» она интерпретирует так, что пользователь ищет сведения о товаре, и формирует выдачу исходя из этих предположений. В «Поиск@Mail.ru» предусмотрено порядка 30 подобных сценариев. Среди ее уникальных возможностей Владимир Габриэлян, вице-президент и технический директор Mail.ru, назвал поиск по лекарствам.

Основным направлением развития поиска является создание самообучающегося механизма, который будет самостоятельно подбирать коэффициенты для формулы релевантности. Для разработки интеллектуального ядра компания пригласила более 60 экспертов по поиску, которые определяют качество выдачи поисковой машины и обучают механизмы искусственного интеллекта. Разработанный Mail.ru механизм был запущен в тестовую эксплуатацию 3 марта, но для пользователей он еще недоступен. Габриэлян рассчитывает к лету отладить его и перевести на него основной поиск.

Впрочем для закрепления на рынке поисковых машин уже недостаточно просто разработать хороший поисковый механизм. Основная битва за рынок происходит на уровне приложений, которые устанавливаются на устройства пользователей: сейчас, по оценкам Габриэляна, половина запросов в поисковую машину приходит не через веб-интерфейс поисковой машины, а от таких приложений.

Первым шагом к пользователю был модуль поиска, который интегрировался в браузер, но очень быстро разработчики браузеров догадались совместить адресную строку и поисковый запрос, предоставив пользователям возможность выбирать поисковую машину. Пользователи в большинстве случаев оставляли настройки по умолчанию, поэтому следующим шагом стали собственные сборки браузеров, где умолчания были в пользу соответствующих поисковых машин. В конце прошлого года Mail.ru выпустила свой браузер под названием «Интернет» на основе Chromium (браузер с открытым исходным кодом, разработанный Google). В результате посещаемость ее поисковой машины значительно выросла.

Впрочем, одна из наиболее драматических битв между поисковыми системами происходит на мобильных платформах, и в ней пока выигрывает Google, имеющая собственную операционную систему. Всем остальным приходится довольствоваться только отдельными приложениями, предустановленными, например, разработчиками мобильных устройств, или оболочками для операционной системы. Еще одним способом проникновения на мобильные платформы могли бы быть операторы связи, которые продают устройства под собственной торговой маркой и через собственную розничную сеть, однако, по мнению Габриэляна, они не настолько популярны у пользователей, чтобы это существенно повлияло на рынок поисковых систем. Поэтому Габриэлян не исключил возможность, что Mail.ru будет разрабатывать собственную мобильную платформу. В любом случае доля поисковой машины сейчас определяется уже не самой технологией поиска, базой проиндексированных страниц или скоростью выдачи ответа, а количеством приложений, в которых интегрирована работа с поисковым веб-сервисом, — это задача не только технологическая, но и организационная.