Онтология и Web

Дезорганизация информации в Web — это, на мой взгляд, основная причина тех бед, которые переживает сейчас Internet-экономика.

Николас Петрили — консультант по компьютерам и журналист. С ним можно связаться по адресу: nicholas@petreley.com

В статье «Семантическая Web» (Semantic Web) Тима Бернерз-Ли, Джеймса Хендлера и Оры Лассила, опубликованной в Scientific American (www.sciam.com/2001/ 0501issue/0501berners-lee.html), предлагается способ сделать информацию более доступной, что, в свою очередь, позволит программистам создавать более интеллектуальное программное обеспечение.

Цель сторонников Semantic Web — добиться, чтобы программное обеспечение могло искать в Web данные, которые ему необходимы, понимало их, создавало перекрестные ссылки и использовало эти данные для решения практических задач. Для достижения этой цели предлагается использовать XML и Resource Description Framework (RDF) в сочетании с концепцией, называемой онтологией.

Предполагая, что все данные, опубликованные в Web, соответствуют стандартам, я мог бы, находясь в 20 милях от дома, «приказать» своему карманному устройству, рассчитанному на работу с Web, назначить визит к дантисту и сделать для этого все необходимое. А именно: найти врача, визит к которому оплачивается моей страховкой, согласовать время посещения, внести соответствующие записи в мое расписание и в расписание врача и составить маршрут, как проехать к этому врачу.

Если вы станете рассматривать Semantic Web как проект развертывания программного обеспечения управления потоками работ и планирования корпоративных ресурсов в глобальном масштабе, то не забудьте, что не существует единого контроля над тем, где в разных подразделениях хранятся данные.

Меня нельзя отнести к оптимистам. Я никоим образом не считаю XML технологией, которая позволяет обмениваться информацией. И в этом я отнюдь не противник точки зрения авторов вышеупомянутой статьи в Scientific American. В ней прямым текстом говорится, что сам по себе XML не подходит для такой цели. XML великолепен в качестве стандартного способа указать на какую-то вещь. Но XML не требует, чтобы вы описывали, что именно эта вещь делает, как она работает и соответствует ли она сама стандарту.

RDF в этом случае слабо помогает. RDF — это вспомогательный стандарт, который описывает вещь в терминах субъекта, предиката и объекта. Если в этом месте вам стало вообще все непонятно, поскольку вы подзабыли грамматику, не стоит расстраиваться, это не самое важное. Тем же, кому все-таки интересно, я советую посетить сайт www.w3.org/RDF.

С другой стороны, если XML указывает на серию цифр, то RDF даст знать вашему компьютеру, например, что это телефонный номер, который требуется набрать. К сожалению, когда на одном Web-сайте используется тег «сотовый», а на другом — «мобильный», RDF не в силах помочь компьютеру понять, что, по сути, это одно и то же.

И здесь-то за дело берутся онтологии, которые представляют собой Web-страницы, обладающие некой мистической объединяющей силой, способной присваивать разным меткам общее значение, даже в разных языках.

Мой сарказм вовсе не означает, что концепция ошибочна. Просто она не учитывает человеческую природу. Дайте людям открытый стандарт, и первое, что они сделают, — это постараются использовать его недостаточность себе во благо. И продавцам подержанных автомобилей, которые в большей степени полагаются на спидометр, чем на XML и RDF, никогда не придет в голову воспользоваться столь расплывчатой концепцией онтологических Web-страниц.

Людей не смущала необходимость повторять слово сотни раз в метатегах HTML, чтобы «обмануть» незатейливые механизмы поиска, обеспечивая себе более высокий рейтинг в эпоху становления Паутины. Semantic Web не меняет того обстоятельства, что эти же самые люди управляют сайтами, которые будут бороться друг с другом за ваши деньги.

Поймите меня правильно. Мне нравится идея Semantic Web. Эта сеть описывает мир, где компьютерная автоматизация не является чем-то уникальным. В наших руках имеются мощнейшие процессорные ресурсы, но неужели современные пользователи должны знать, что такое диски и как отличать исполняемые файлы, присоединенные к сообщению электронной почты, дабы предотвратить попадание на компьютер «троянского коня» или вируса!

И потом, мне нравится в Semantic Web еще одна вещь. Если попытаться представить себе картину в целом, то вы поймете, что на самом деле это распределенная объектно-ориентированная система управления базами данных, рассчитанная на работу с текстом (OORDBMS). Без шуток. Посмотрите спецификации, и вы обнаружите в ней объекты, свойства, методы, наследование и реляционные иерархии. Я большой поклонник технологии OORDBMS. Только мне хотелось бы знать, как вы убедите миллионы администраторов баз данных играть по столь жестко определенным правилам.