Система персонального, или пользовательского, интернет-поиска (Custom Search Engine) — это сервис, позволяющий создать и настроить специализированный поисковик, который учитывает в результатах ваши личные предпочтения и тематические интересы, другими словами — контекст поиска. В простейшем случае такой поиск осуществляется по набору указанных пользователем сайтов, более сложные варианты подразумевают тонкую настройку выдачи результатов, автоматическое добавление тематических сайтов в персональный индекс и организацию совместной работы над поисковиком группы единомышленников. Ценой небольшой потери в широте охвата персональный поиск дает возможность заметно улучшить точность.

В настоящее время для использования рекомендуются проекты Google Custom Search Engine и Flexum. Другие общедоступные платформы персонального поиска, например Swiki и Mojeek, хотя и содержат ряд оригинальных функций, серьезно уступают лидерам и не отличаются качественной работой с русскоязычными ресурсами.

Google Custom Search Engine

Проект Google Custom Search Engine — наи-более крупная система персонального интернет-поиска. Ее интерфейс доступен на нескольких десятках языков. Предусмотрен и русский вариант. Правда, перевод пока неполный, особенно справочной системы.

Форма создания нового поиска Google Custom Search Engine

Создание нового поисковика начинается с регистрации на сайте проекта. Если у вас уже есть учетная запись Google, то переходите к следующему этапу. В специальной форме нужно указать имя поиска, дать краткую аннотацию поисковика и привести набор ключевых слов. Доступен выбор одного из трех режимов работы будущей машины. Это простой поиск по всей базе Google, поиск только по сайтам, непосредственно включенным в персональный индекс, и поиск по базе Google с выводом включенных в индекс сайтов на первые позиции выдачи. Поскольку используется готовая индексная база Google, то проверить работу своего поисковика можно сразу же после его создания.

Наиболее интересный и ответственный этап работы — настройка поисковика. В Google Custom Search Engine для этого следует использовать инструменты предлагаемой Панели управления, а также прямую правку настроечных XML-файлов системы. Панель управления разделена на отдельные вкладки, где размещены инструменты добавления новых сайтов в индекс, настройки внешнего вида интерфейса поиска и др. Особого внимания заслуживает система присвоения сайтам тематических ярлыков, что позволяет организовать в интерфейсе готового поисковика поиск по тематическим кластерам.

Google Custom Search Engine умеет работать не только с прямыми адресами, но и с их масками (например, sait. domen. com/*). Благодаря этому можно добавлять в индекс группы сайтов или, наоборот, ограничивать индекс определенного сайта каким-либо одним его разделом. Кроме того, можно автоматически включать в свой индекс все ресурсы, на которые ссылается указанная вами веб-страница. Эта функция, называющаяся «Динамическое извлечение страниц», доступна на вкладке «Сайты» Панели управления поисковиком.

Прямая правка настроечных файлов системы требует минимальных знаний языка XML, однако предоставляет заманчивые возможности полного контроля над поведением поисковика. Доступ к файлам можно получить на вкладке «Дополнительно» общей Панели управления персонального поисковика.

Стандартный интерфейс поисковика на базе Google Custom Search Engine

В системе Google Custom Search Engine действуют два настроечных файла: «Контекст», с общими параметрами поисковика и описаниями тегов, а также «Аннотации», где содержится перечень включенных в ваш индекс сайтов и индивидуальные настройки каждого из них. Для редактирования данных файлов сначала потребуется загрузить их на свой компьютер, а после внесения правок загрузить новые файлы на сервер Google.

В настоящее время список поддерживаемых тегов не очень велик, однако результаты их применения весьма интересны. Например, тег BOOST позволяет управлять позицией определенного сайта на странице выдачи результатов поиска. По умолчанию в персональном поиске применяются стандартные алгоритмы ранжирования Google, однако они не всегда выгодны для тематического поиска, поскольку стараниями оптимизаторов раскрученный сайт самого общего содержания может обходить полезный, но незаметный специализированный источник. А тег BOOST как раз и позволяет поднять данные с таких ресурсов на первые позиции в результатах поиска.

Для этого сначала в XML-файле «Контекст» необходимо найти раздел и с помощью контейнера создать новую метку с именем, предположим, «Лучшие сайты». В ее параметрах в виде численного значения устанавливается «вес» результатов из источника, к которому будет применена эта метка. Диапазон допустимых значений — от –1 до максимального 1, означающего, что результаты с определенного сайта всегда будут на первой позиции в поисковой выдаче. Поскольку допускается применение дробных значений, данный инструмент обладает очень большой гибкостью. Затем выполняется правка файла «Аннотаций». Здесь нужно добавить созданную нами метку к тем сайтам, результаты с которых должны попасть на первые места выдачи. Для этого к описанию нужных сайтов добавляется тег с именем нашей метки («Лучшие сайты») в качестве параметра.

На вкладке «Дополнительно» Панели управления Google Custom Search Engine находятся инструменты работы с настроечными XML-файлами поисковика 

Такие текстовые настроечные файлы, конечно, не очень удобны для правки вручную, однако позволяют реализовать несколько интересных автоматизированных режимов работы с Google Custom Search Engine. Дело в том, что такие файлы допустимо готовить в офлайновом режиме и потом уже загружать на сервер. Таким образом, например, можно не набирать весь список сайтов в онлайновой форме, а заранее подготовить и загрузить на сервер файл «Аннотаций» с перечнем нужных сайтов и их свойствами. Следует только помнить о существующем в настоящее время ограничении на количество позиций в таком файле-списке — не более 5000 сайтов. Кроме того, разработчики Google реализовали уникальный режим «связанного» поиска. В данном режиме настроечные файлы поиска могут храниться в любом внешнем источнике, например на вашем собственном сайте, или вообще генерироваться любыми удобными вам средствами и динамически подгружаться на сервер Google при каждой отправке запроса с помощью формы поиска. В принципе в таком режиме возможна генерация индивидуальных настроек для каждого пользователя, обращающегося к вашему поисковику.

Форму поиска Google Custom Search Engine можно установить на своем сайте или в блоге, просто скопировав предлагаемый системой код формы на свою страницу.

Google Custom Search Engine предлагает несколько дополнительных инструментов, облегчающих работу с персональным поисковиком. Дополнение к браузерам Firefox и Internet Explorer «Указатель Google» позволяет в ходе серфинга быстро добавлять открытые в браузере страницы к своему персональному поисковому индексу. Также предлагается предназначенный для персонального портала iGoogle виджет Google Custom Search Console, который предоставляет возможность поиска с помощью своего персонального поисковика, а также быстрый доступ к его настройкам.

Flexum

Российский проект персонального поиска Flexum стал достойным ответом разработке, представленной Google, причем в некоторых случаях он объективно предпочтительнее. Flexum принципиально отличается от Google Custom Search Engine подходом к индексированию сайтов персонального поиска. Если Google использует сведения, уже находящиеся в главной базе поисковика, то Flexum индексирует указанные пользователем сайты «с нуля», причем владелец персонального поисковика получает полный контроль над этим процессом.

Flexum предлагает два режима построения персонального поиска: «Простой» и «Экспертный». В первом из них, как и положено, позволяется совершить минимум действий для добавления сайтов в список для последующего индексирования — достаточно заполнить одну-единственную форму. «Экспертный» режим подтверждает свой статус, предлагая довольно серьезный набор инструментов, заслуживающий подробного рассмотрения.

Интерфейс «Простого» режима работы с Flexum

Интерфейс «Экспертного» редактора разделен на два фрейма, в одном из которых выводится список элементов персонального индекса (сайтов и отдельных веб-страниц), а в другом — параметры выбираемых в этом списке позиций. Новые сайты добавляются вручную — по одному сайту за операцию. «Оптовый» режим загрузки ссылок, который предусмотрен в Google Custom Search, во Flexum пока не реализован. Допускается применение масок адресов, чтобы индексировать определенные разделы сайтов.

Для каждого включаемого в базу сайта следует указать ключевые слова, предназначенные для группировки ссылок по тематическим рубрикам. Кроме того, доступна гибкая регулировка глубины индексирования сайта. Данная опция отвечает за автоматическое индексирование не только указанной стартовой страницы, но и всех других страниц, на которые она ссылается. Числовое значение указывает, сколько таких переходов может сделать робот-индексатор. При значении, большем, чем 2, количество таких автоматически обнаруженных ссылок может резко возрасти, что необходимо учитывать при определении следующей настройки — квоты на каждый сайт. По умолчанию такая квота равна 20 Мбайт, однако это значение можно вручную изменять в пределах общей квоты учетной записи.

Как и Google Custom Search, система Flexum дает возможность тонкой настройки позиций выдачи с определенного сайта. Любому сайту в индексе можно присвоить рейтинг от единицы до пятерки, для чего предназначено специальное раскрывающееся меню в настройках поиска.

Пример стандартного интерфейса поисковика, построенного на базе Flexum

После включения сайта в список он ставится в очередь на индексирование. Для бесплатных учетных записей данный процесс может растянуться до нескольких дней. После приобретения коммерческой учетной записи частоту обновления индекса допустимо определять самостоятельно.

Особенность персонального поиска Flexum — его сильная социальная составляющая. Сама концепция проекта, ориентированная на работу с поисковиком вручную, подталкивает пользователей к взаимодействию. Совместные усилия облегчают наиболее сложный этап работы над поисковиком — заполнение списка сайтов, подлежащих индексированию. Процесс идет в двух направлениях. Во-первых, любой пользователь может предложить свою помощь автору понравившегося поисковика прямо на домашней странице такой машины. В стандартном интерфейсе всех Flexum-поисковиков предусмотрена соответствующая ссылка, отправляющая сообщение владельцу поисковика. После прихода подтверждения добровольный помощник получает права на пополнение списка поиска. Во-вторых, для привлечения помощников владелец поисковика может отправить приглашения через внутреннюю систему обмена сообщениями Flexum. Для этого предусмотрен специальный инструмент под названием «Коммуникатор», помещенный в «Личный кабинет» — особый раздел персонального поисковика. Там можно составить свою личную анкету-визитку, которая будет видна другим пользователям ресурса.

Еще один способ пополнения собственной базы — применение наработок других поисковиков Flexum. Если вы зайдете в систему под своей учетной записью и обратитесь к любому поиску Flexum, то рядом с каждой найденной ссылкой увидите кнопку «Копирование сайта в свой поиск». С ее помощью вы сумеете быстро пополнить собственную базу уже проиндексированным Flexum сайтом.

Flexum предоставляет каждому автору персонального поисковика в качестве «социальных» бонусов собственный блог и систему публикации тематических статей, сообщения о которых попадают на ленту новостей домашней страницы Flexum. Эти инструменты следует использовать для продвижения своего проекта.

«Экспертный» режим предоставляет большое количество инструментов тонкой настройки поиска

Можно пользоваться персональным поиском как зайдя на его домашнюю страницу с адресом типа «имя поисковика. flexum. ru», так и помещая поисковую форму Flexum на собственном сайте. В первом случае предлагается стандартный интерфейс поиска, состоящий из трех разделов. Кроме списка выданных результатов поиска, на странице показаны блок тематических разделов поисковика, сформированный на основе присвоенных сайтам ключевых слов, и «социальный» раздел со ссылками на блог поисковика, анкету автора поиска и его контактные данные. Чтобы создать виджет для внешнего ресурса, достаточно просто вставить на свою веб-страницу сгенерированный Flexum-код, описывающий форму поиска и его базовые параметры.

* * *

Оба рассмотренных сервиса позволяют построить хороший персональный поисковик. В умелых руках они способны стать мощным средством тематического интернет-поиска. Различие их возможностей зависит от выбранной разработчиками данных систем модели индексирования ресурсов. Однозначно определить, какой из предложенных подходов лучше, довольно сложно, поскольку каждый имеет свои достоинства и недостатки. Важно хорошо представлять их себе и выбирать систему персонального поиска, исходя из собственных потребностей.

Создание поисковика средствами Flexum занимает гораздо больше времени, поскольку, во-первых, потребуется составлять полный список индексируемых сайтов, во-вторых, системе понадобится определенное время на индексацию. Как только пользователь начинает работать в Google Custom Search, ему сразу же по умолчанию становится доступна вся огромная индексная база Google. Кроме того, в копилке проекта Google — уникальные возможности автоматизации наполнения индексной базы и управления настройками поисковика.

Ценой такого «быстрого старта» стала жесткая привязка к базе Google. Персональный поисковик будет полностью зависеть от качества работы индексирующего робота Google. Если определенный сайт не включен в базу либо проиндексирован поверхностно, то с этим ничего не поделать.

Предлагаемая Flexum «честная» индексация предоставляет пользователю полный и гибкий контроль над этим процессом, что будет ему весьма кстати тогда, когда он планирует использовать какой-либо специфический набор сайтов. Для работы с небольшими и «малозаметными» веб-проектами такой вариант будет, пожалуй, более предпочтительным, чем система от Google. Кроме того, Flexum предлагает специальную льготную программу для тематических порталов, решивших построить свою систему поиска на платформе Flexum.

Персональный поиск — замечательный инструмент, однако не стоит переоценивать его возможности. Как и у любых средств, у него есть недостатки. Если сравнивать персональные поисковики со специализированными «вертикальными» решениями, то нетрудно заметить, что для последних, как правило, разрабатывают соответ-ствующие алгоритмы индексации ресурсов, а зачастую предлагают и специализированные интерфейсы. Персональные же поисковики используют универсальные алгоритмы и типовые интерфейсы, что несколько ограничивает их возможности.


Google Custom Search Engine

Оценка: 5 / 5
Язык интерфейса: Несколько десятков языков, в том числе русский.
ЦЕНА: Бесплатно.
САЙТ: www.google.com/coop/cse/


Flexum

Оценка: 5 / 5
Язык интерфейса: Русский.
ЦЕНА: Базовый — бесплатно; расширенный — от 2400 руб. в месяц; портальный — от 7200 руб. в месяц.
САЙТ: www.flexum.ru

Купить номер с этой статьей в PDF
2925