Найти нужную информацию становится все труднее. Чтобы не заблудиться, лучше всего обратиться к средствам поисковых механизмов.

Сайт WholeWeb.net, работы над которым планируется завершить в июне 2000 года, отличается необычным подходом к поиску информации в Web. Его создатели намерены проиндексировать почти каждое слово из миллиарда страниц (общее же число страниц в Сети, по оценкам специалистов WholeWeb, сегодня превышает полтора миллиарда). Президент WholeWeb Марк Армстронг подчеркнул, что ближайшим конкурентам его компании к сегодняшнему дню удалось проиндексировать не более 200 млн. страниц.

Программные средства WholeWeb заносят собранную информацию в специальную базу данных, что позволяет заметно упростить процедуру поиска и сортировки по сравнению с применением механизмов, использующих технологию обычного просмотра текста.

«Наша система предоставляет пользователю возможность быстро вернуться к нужной информации», — отметил Армстронг.

Прежде чем начать поиск, можно определить несколько ключевых слов, присвоив каждому из них свой коэффициент значимости. Результаты поиска упорядочиваются по числу найденных слов, а также по дате последнего изменения документа. После получения списка ссылок можно сузить критерии поиска, добавив и удалив некоторые термины из списка. Эта процедура повторяется до тех пор, пока не будет найден искомый сайт.

В каждом поисковом механизме используются свои собственные методы; в некоторых из них в той или иной форме предусматривается вмешательство в процесс поиска со стороны пользователя. Создатели WholeWeb, напротив, рекламируют такие качества своего продукта, как высокий уровень автоматизации и большая скорость.

«Мы выбрали принципиально новый подход для построения поисковых средств в Web, — подчеркнул Гэвин Робертсон, вице-президент WholeWeb. — Традиционные технологии баз данных оказываются неработоспособными при очень большом количестве записей».

Поделитесь материалом с коллегами и друзьями