Создание новостных Web-узлов с пмощью Inktomi Directory Engine

Разработчики механизма
Inktomi Directory Engine —
Хонг Ян Же, Майкл Палмер
(руководитель проекта),
Гордон Риос, Гордон Сан,
Шон Сачтер
Компания Inktomi анонсировала инструментарий, который автоматизирует создание каталогов информационного наполнения, предназначенных для редакторов порталов и новостных Web-узлов. Подобный подход позволяет быстро добавлять новые категории тем к содержимому Web-узлов.

По словам Пола Гаузьера, директора Inktomi по вопросам технологий, программный пакет Inktomi Directory Engine может также использоваться для обновления категорий, снабжая страницы узла новейшими ссылками на другие, связанные по тематике ресурсы Web.

Работающий с данным программным пакетом редактор имеет возможность добавлять новую категорию или ссылки на информацию, посвященную вспыхнувшей войне, крушению самолета или другим событиям, о которых хотят узнать пользователи. Он может применять Inktomi Directory Engine для создания ссылок на данные, связанные с уже опубликованными на этом или других узлах сведениями.

Этот специалист определяет стандарт на категорию, подбирая определенные документы, связывая их с другими страницами и «переправляя» экземпляры в механизм создания каталогов.

Этот механизм анализирует ключевые слова и ссылки на аналогичную информацию, создавая алгоритм, который будет использоваться механизмом просмотра Internet с целью поиска соответствий.

При создании каталогов информационного наполнения Web необходимо участие и людей, и компьютеров, поскольку Internet разрастается настолько быстро, что человеку становится все сложнее следить за стремительно увеличивающейся в объеме интерактивной информацией. Сейчас Всемирная паутина содержит 400 млн. страниц, а к 2000 году, согласно прогнозам исследовательской компании Forrester Research, их число достигнет 1 млрд.

Механизм создания каталогов использует разработанную в Inktomi новую технологию, получившую название Concept Induction, которая позволяет находить соответствия между фрагментами информации.

Действие Concept Induction Гаузьер объяснил на примере слова «кристалл». Если слово «кристалл» встречается в документе, где содержится выражение «материнская плата», механизм сделает вывод, что это слово имеет значение «электронная микросхема» и не имеет никакого отношения к драгоценным камням. Выбор зависит от того, относится ли анализируемая категория к аппаратному обеспечению или к ювелирному делу.

Анализ концепций и ссылок помогает отфильтровать мусор, то есть ссылки на узлы недобросовестных производителей, рекламирующих свой товар недозволенными методами, а также порнографические узлы, которые пытаются «обмануть» механизмы поиска, размещая на своих страницах популярные выражения, часто используемые в запросах.

Технология Inktomi уже применяется в некоторых механизмах поиска, в том числе на GoTo.com и 45 информационных узлах Knight Ridder — одного из крупнейших газетных издательств США.

Как отметил Гаузьер, обычный потребитель уже использует Inktomi Search Engine, а возможно и Inktomi Shopping Engine. Directory Engine дополняет эти предложения фирмы.

Основанная в 1996 году компания Inktomi стала известна благодаря механизму поиска HotBot, который сначала применялся издательской компанией Wired Digital и на Web-узле www.msn.com корпорации Microsoft. Первая до сих пор использует механизм поиска Inktomi для обработки некоторых запросов, но в основном ориентируется на решение фирмы Direct Hit. А корпорация Microsoft подписала соглашение с AltaVista на применение ее механизма поиска. Взамен Microsoft разрешила реализовать на узле AltaVista свою бесплатную службу электронной почты Hotmail.