Если во всем мире Usenet с самого начала воспринималась в качестве места для неформального обсуждения различных проблем - от контроля рождаемости до событий августа 1991 года в России, - то в нашем Отечестве Usenet начала использоваться провайдерами, главным образом организациями, входившими в сеть Relcom, как коммерческое предприятие. Динамика перераспределения информационных ресурсов Сети между различными технологиями чрезвычайно интересна и поучительна. Она позволяет делать предположения о дальнейших направлениях развития информационных технологий Сети.

Первоначально Сеть задумывалась как средство доступа к вычислительным мощностям. Но как только пользователи получили эту возможность, сразу стало понятно, что этим дело не ограничится. Для научной общественности всегда была актуальна проблема непосредственного общения. Ради этого и устраиваются конференции, семинары, школы и т. п. Сеть позволила реализовать такую возможность сразу в виде Request For Comments - знаменитых RFC. Но хотелось чего-то более совершенного, чем простая рассылка почтовых сообщений. Сначала появился протокол UUCP, который потом был взят на вооружение в 1979 г. аспирантами Университета Дьюка (шт. Северная Каролина, США) Томом Траскотом и Джимом Эллисом - создателями первой системы телеконференций в Internet.

Usenet интересна во многих отношениях. Во-первых, интерес вызывает развитие архитектуры системы. Сначала это были просто скрипты для просмотра передаваемых по сети файлов. Затем они были переписаны на С.

При работе через UUCP вся масса статей передавалась по сети для каждого из читателей Usenet, что вызывало перегрузку каналов. По нынешним понятиям, канал в 9600 бит/с - это вообще не канал, а если внимательно прочитать файл termcap на любой Unix-системе, относящийся к 1986 году, о нем говорится, как о скоростном канале связи. Как ответ на эту проблему рождается протокол NNTP (Network News Transfer Protocol), который позволяет перейти от архитектуры "каждый с каждым" к архитектуре распределенной ИС.

Во-вторых, интересны и изменения в тематике телеконференций. Начиналось все с обсуждения проблем операционной системы Unix, потом темы телеконференций стали отражать круг естественно-научных проблем. За ними последовали конференции по интересам: бейсбол, отношения полов, кулинарные рецепты и т.п. С появлением достаточного числа пользователей в Usenet начала внедряться реклама товаров и услуг.

Если внимательно присмотреться к этому процессу, то развитие World Wide Web идет по тому же самому пути. С технической точки зрения мы становимся свидетелями появления и широкого внедрения распределенной системы Web. Такое утверждение может показаться странным, если вспомнить о повсеместном построении Web-узлов и их использовании миллионами пользователей Сети; но обычно речь идет о том, что каждый пользователь, желающий получить доступ к ресурсу, обязан связаться с первичным сервером этого ресурса. Именно такова суть принципа "каждый с каждым". Однако картина меняется при применении кэширующих proxy-серверов. Пока еще не организовано реплицирование документов, т. е. принудительное обновление документов сервером-первоисточником, но дискуссии на эту тему уже ведутся довольно давно.

Другая проблема - это повышение эффективности обмена с сервером. В настоящее время Web-технология не поддерживает сеансового обмена данными. В чистом виде сеансы не поддерживаются и в Usenet, но здесь от отложенного просмотра через электронную почту перешли к чтению новостей клиентом с сервера непосредственно. Работа с традиционными базами данных требует наличия механизма обработки транзакций, а вот этого-то в Web как раз нет. Но, видимо, сеансовый режим работы в Web очень скоро появится, потому что он необходим для разработки intranet-систем.

Еще одна техническая параллель - это формат обмена данными. И здесь представлены схожие пути развития Internet-технологий. В настоящее время просто невозможно представить телеконференцию, в которой не использовалась бы графика, либо даже видео или аудио. Многочисленные телеконференции типа pictures или movies требуют обязательной передачи по сети не только текста. В свое время, чтобы удовлетворить этим потребностям, было создано расширение формата текстового сообщения Internet (RFC-822) стандартом MIME. До недавнего времени в Web этот стандарт использовался главным образом для привязки расширений имен файлов к программам просмотра этих файлов, но затем оказалось, что сфера применения стандарта может быть гораздо шире.

В MIME есть тип сообщения multipart. В современный стандарт HTML-форм введен тип INPUT-поля file, который позволяет, если указан тип multipart, передавать серверу не только данные, которые пользователь вводит в полях формы, но и файлы из локальной файловой системы компьютера, на котором браузер запущен.

Если сравнить динамику развития тематик в Web и в Usenet, то здесь тоже наблюдается некоторое сходство. Первые Web-узлы принадлежали научным учреждениям. Эти организации стремились подключить максимально возможное число традиционных ресурсов через Web, тем самым форсируя информационное наполнение Паутины. Затем в Web начали появляться страницы энтузиастов. Эти страницы строились точно так же, как и конференции Usenet, - достаточно было бросить клич о построении Web-узла по той или иной тематике и тут же находилось множество энтузиастов, стремящихся помочь в строительстве Web-узла. В последнее время таких инициатив становится все меньше.

Если сопоставить Usenet и World Wide Web, то Usenet в сравнении с Паутиной - просто богадельня, т. к. подавляющее большинство конференций предоставляется на безвозмездной основе. Но это во всем мире. У нас же дело обстоит по-другому. Практически с самого начала строительства Internet в России наши провайдеры эту информацию продавали. Если посмотреть прошлогодние прайс-листы, то информационное обслуживание в большинстве случаев - это подписка на телеконференции Relcom-Demos. В этом смысле подписка на коммерческие Web-серверы не представляется чем-то новым. При этом словечко "Free", на отечественных серверах используется не реже, чем у зарубежных коллег. И процент свободно доступных ресурсов практически тот же.

В свое время в телеконференциях появился такой подраздел, как FAQ - Frequently Asked Questions, отпочковавшийся потом в отдельный жанр информационного обмена. Фактически FAQ берут свое начало от архивов новостей. В этих архивах оседало все, что так или иначе пользовалось повышенным спросом у подписчиков. Общие правила информационного обмена типа 80/20 (т. е. 80% пользователей нуждаются лишь в 20% информации от полного объема информационных фондов) справедливы и для информационных ресурсов Сети. Если посмотреть на современные Web-узлы, то и здесь постепенно начинают проявляться эти закономерности. Во многих случаях именно этим объясняется изменение внешнего вида узла, а не только применением новых технологических приемов или рекламой.

Раз появились архивы, то немедленно появляются и поисковые машины. Самостоятельной поисковой машины в Usenet не было, обычно телеконференции интегрировались с другими ресурсами, например Gopher. Сейчас такая интеграция продолжается, но уже совместно с Web. Типичным примером здесь является Lycos. Любопытно, что Web наряду с закономерностями развития технологии перенимает и недостатки своих предшественников. Например, потерю информационных источников. Для Usenet типично отсутствие статей, на которые ссылаются поисковые машины. Срок хранения статей в Usenet не превышает обычно пяти дней (если только статья не попала в архив). Страницы Web также не вечны. В индексах машин оказывается большое количество "мертвых" ссылок. Любопытно, что некоторое время назад Relcom объявила о сертификации серверов, правда, проводилась она по другому поводу, но мысль, в принципе, совершенно правильная. Собственно подход не нов. GopherSpace строится по такому же принципу: сначала надо зарегистрировать свой сервер, а уже потом на него запускается "паучок". Однако, занимаясь накоплением информационных массивов, информационные службы Сети не очень заботятся о надежности собранной информации. И это в зарубежных архивах - что же тогда говорить об отечественных. При этом существует программное обеспечение проверки ссылок, но, видимо, оно используется нерегулярно. Во всяком случае, отлаженной системы поддержки распределенной базы данных, как это сделано в DNS, пока в Web нет, но, вероятно, такая система появится в ближайшем будущем.

Другим важным моментом при получении доступа к ресурсам Сети является регистрация. Любая система начинается с этого. Первоначально ведется журнал посещений, где фиксируются обращения пользователей, затем появляется механизм управления этим процессом. В Usenet это вылилось в контролируемые (moderated) телеконференции. Совершенно очевидно, что регистрация появилась и в Web. Собственно для этого и был придуман механизм HTML-форм. Практически все Web-узлы, администраторы которых заинтересованы в обратной связи с пользователями, обязательно имеют страничку регистрации.

Конечно, не все развивается абсолютно одинаково. Есть отличия, и довольно существенные, которые объясняются появлением новых возможностей и повышением производительности оборудования. В частности, многие свойства локальных информационных систем раньше нельзя было применить в Сети, к примеру из-за использования медленных каналов связи. Другая особенность Web связана с ее децентрализацией. В настоящее время Web - это не только информационная среда, но и могучий инструмент, позволяющий навязывать людям свой взгляд на ту или иную проблему. Это можно легко продемонстировать на примере информационных систем Сети. Индексируя одни и те же информационные массивы, системы образуют совершенно разные поисковые образы информационных ресурсов. Как следствие, при поиске в разных информационных системах результаты получаются разные. Многие авторы Web-узлов стараются учесть эти особенности. Поэтому простое использование средств нормализации лексики типа Яndex в ряде случаев способно даже навредить (в простых случаях Яndex - это замечательный инструмент, но не об этом сейчас речь). Altavista прекрасно найдет то, что необходимо и без автоматического расширения запроса всеми известными словоформами: нужно просто знать что вы ищете, равно как и профессиональную лексику, которая в данном контексте применяется. Сеть выглядит слишком доступной и простой, но почти все рано или поздно убеждаются в том, что проще и дешевле воспользоваться услугами профессионалов, чем тратить свое время на поиск редких документов в Сети. Вообще говоря, это тоже не новость. В мире существует огромное количество профессиональных информационных служб, которые предоставляют услуги по поиску информации. В Internet их пока нет. Во всяком случае, громко о себе они еще не заявили.

И последнее. В свое время Гардфилд создал индекс цитирования научной литературы. Казалось бы - сугубо дотационное предприятие, но жизнь показала, что это не так. Человеческое тщеславие - столь же могучий стимул, как и деньги, поэтому институт Гардфилда процветает. В Internet всеобъемлющего индекса цитирования страниц Web пока нет.


Павел Храмцов - руководитель группы РНЦ "Курчатовский Институт". С ним можно связаться по телефону: (095) 196-9124, или по электронной почте по адресу: paul@kiae.su.

К 2001 году объем рынка серверов Web достигнет 800 млн. долл.

Мировой рынок серверов Internet продолжает расти, и производители стремятся выработать стратегию, дабы занять на нем подобающее место, как сообщает International Data Corp..

"Oracle находится в том же состоянии, что и Sun с IBM, - заявил Тед Джулиан, менеджер по исследованиям Internet компании IDC. - Добавив поддержку Internet в свои устаревшие продукты, они ищут пути дальнейшего развития".

Сейчас стандарты и пути развития этой области рынка определяет корпорация Netscape Communications. "Однако через некоторое время, когда на рынке появится больше интегрированных пакетов, конкуренты будут давить на нее сильнее", - утверждает Джулиан.

В новом докладе IDC Global Internet Server Software ("Глобальный рынок ПО для серверов Internet") исследователи опубликовали прогноз роста рынка серверов Internet. Предполагается, что с 637 тыс. копий, проданных в прошлом году, он увеличится до 1,2 млн. копий к 2001 году, а его объем достигнет 802 млн. долл.

Рост рынка во многом связан с тем, что сейчас большинство поставщиков ПО добавляют поддержку Internet в существующие продукты, в том числе и в серверы сообщений Exchange компании Microsoft и GroupWise производства Novell.

В 1996 году основу рынка составляли серверы HTTP (Hyper Text Transport Protocol, протокол передачи гипертекста): было продано 500 тыс. копий на сумму 57 млн. долл. Тем не менее, при средней стоимости продукта в 100 долл. рынок серверов HTTP перестает быть самым прибыльным.

В докладе IDC утверждается, что серверы HTTP не исчезнут полностью, но "переродятся" в серверы информационного наполнения, предоставляющие куда более широкие возможности.

В 1996 году за серверами HTTP следовали серверы обработки сообщений и серверы групповой работы (collaborative server). По данным IDC, доходы от их продаж составили 50 млн. долл. и 18 млн. долл. соответственно.

В 1996 году 65% серверов Web работали на платформе Unix, а 28% - под управлением Windows NT. Остальные 7% приходились на серверы, работающие в системах OS/2, Macintosh или NetWare.

К 2001 году ситуация изменится в пользу Windows NT, доля которой, по прогнозам, составит 59%. Unix отойдет на второй план и будет использоваться на 22% серверов. "Windows NT начнет ориентироваться на крупные системы обработки транзакций, чувствительные ко времени выполнения, которые, хотя их и будет немного, принесут самые высокие прибыли", - предполагает Джулиан.

Среди операторов систем меньшего размера дольше всех продержится Novell.

"Novell следует воспринимать серьезно. Если у них сохранится хотя бы часть от установленных систем, этого все равно будет достаточно много", - заявил Джулиан. IDC ожидает, что Novell NetWare станет использоваться на 16% серверов Web, хотя в прошлом году эта цифра составляла всего 2%. Рынок мелких и средних компаний, на который традиционно ориентируется Novell, будет представлять больший интерес с точки зрения разработчиков ПО для серверов Web. "Лакомым куском теперь стал рынок предприятий, так как сейчас спрос рождается именно там, - добавил Джулиан. - Настоящая битва разгорится именно вокруг мелких компаний".

В своем докладе исследователи IDC разделили серверы Internet на несколько категорий, включающих серверы информационного наполнения и HTTP, серверы групповой работы, серверы календарного планирования, серверы сообщений, серверы новостей и NTTP (Network News Transport Protocol, протокол сетевой передачи новостей), proxy-серверы, сертифицирующие (certificate) серверы и серверы каталогов.

В докладе не был рассмотрен такой сегмент рынка, как торговые серверы, - именно он, по прогнозам, вырастет очень существенно. "К 1998 году рынок серверов приложений по уровню доходов превзойдет серверы информационных инфраструктур", - уверен Джулиан.

Кроме того, в докладе отмечается, что серверы intranet будут развиваться стабильно, как по количеству, так и по объему прибыли, в течение ближайших пяти лет. Доходы от продажи серверов Internet будут расти до 1999 года, после чего начнут уменьшаться в связи с глобальным снижением цен, которое произойдет из-за популяризации этой отрасли информационной индустрии.

- Торстен Буссе,

Служба новостей IDG, Сан-Франциско