«Поисковик» расширил свои возможности

Месяц назад компания «Яндекс» объявила об инвестициях в объеме более 5 млн. долл. в свои Internet-проекты, а 6 июня полностью сменила интерфейс основного ресурса — поисковой системы. Ровно в 2 часа дня он стал очень простым и незатейливым.

«Мы хотим начать с чистого листа и показать, какой из наших проектов главный, — прокомментировал свои действия Аркадий Волож, генеральный директор «Яндекс». — Но в скором времени на этом ?чистом листе? появятся и другие ресурсы».

Поисковая машина Яndex, как и раньше, понимает запросы на естественном языке, но при этом не все слова она считает одинаковыми. Прежде чем начать поиск, машина проводит синтаксический анализ запроса, выделяет его структуру и использует эту информацию при ранжировании результатов выдачи. Например, согласованные слова в запросе поисковая машина пытается искать вместе. Сотрудники «Яндекс» уже отметили увеличение средней длины запроса до 2,5 слов. Кроме того, в новой поисковой машине используется более быстрый робот, обрабатывающий до 2 млн. документов в день.

В базе Яndex хранится 20 млн. ссылок, и робот обходит все известные документы примерно за десять дней. Это обеспечивает минимальное количество оборванных ссылок и повышает качество поиска. Кроме того, сервер Yandex.ru обменивается индексами с «младшими братьями» — локальными поисковыми машинами Yandex.Site на других Web-серверах. Этот обмен учитывает только изменения, произошедшие в содержании сервера, что позволяет более эффективно и оперативно добавлять его содержание в поисковую машину.

Новый Яndex будет искать не только в Internet, но и в двух новых источниках информации — новостях и электронных магазинах. Раньше поиск по новостям был невозможен, поскольку индекс меняется только раз в неделю. Сейчас по 15 серверам новостных агентств, с которыми «Яндекс» заключил специальное соглашение, поиск выполняется каждые полчаса. Причем формат представления новостной информации позволяет ранжировать документы по дополнительным параметрам, например времени публикации. Аналогичные договоры заключаются и с электронными магазинами, где с помощью Яndex можно искать различные товары и сравнивать их цены.

Ответ Яndex стал структурированным по категориям. То есть в ответе указывается, в каких категориях есть большое количество наиболее релевантных документов. Это позволит посетителям уточнить запрос в случае необходимости. Поисковая машина также анализирует запросы пользователей и пытается строить по ним тезаурус. Например, если два слова часто встречаются в одном запросе, то машина считает их близкими по смыслу. Если другой пользователь набрал одно из слов, то машина предложит ему поискать и в близких словах.

Также усовершенствован НИНИ-индекс, который показывает популярные запросы недели. Кроме того, добавлен раздел «популярные находки», куда помещаются ссылки на ресурс, который был выбран несколькими пользователями, но который располагался дальше второй страницы выдачи результата. Таким образом, Яndex еще больше расширил свои возможности по поиску информации, оставаясь при этом одним из лидеров по объему проиндексированной информации.

Поделитесь материалом с коллегами и друзьями