ЧИСЛО ПРОГРАММ ДЛЯ WEB-ИЗДАТЕЛЬСТВ УВЕЛИЧИВАЕТСЯ, ОНИ СТАНОВЯТСЯ ГРАФИЧЕСКИМИ И ПРИОБРЕТАЮТ ОЧЕРТАНИЯ СЕРЬЕЗНЫХ ПРОДУКТОВ. ОСНОВАННЫЕ НА WINDOWS ИНСТРУМЕНТЫ ПОМОГУТ ВАМ ДОСТИЧЬ ВЫСОТ МАСТЕРСТВА В ПЛЕТЕНИИ ПАУТИНЫ.

Роберт Ричардсон

ВОЗЬМИТЕ НА ЗАМЕТКУ
ПРИЯТНЫЙ И РАЗДРАЖАЮЩИЙ
ИДЕАЛЬНЫЙ ИЗДАТЕЛЬ
ПОДАЙТЕ ЕГО НА СТОЛ
СТЕКИ ПРОТОКОЛОВ: СРАВНИТЕЛЬНЫЙ АНАЛИЗ WINDOWS
ПОД НОВЫМ УПРАВЛЕНИЕМ
ПЛЕТЕНИЕ ПАУТИНЫ С ПОМОЩЬЮ OS/2

По нашему глубокому убеждению, настоящий сетевой хакер скромному настольному ПК предпочел бы компьютер с Unix. Но вашему сердцу, во всяком случае сегодня, многофункциональный текстовый процессор милее куда больше, нежели причудливый редактор emacs в среде Unix. Откровенно говоря ничего удивительного в этом нет, - Netscape Navigator (Netscape Communication, Montain View, CA) представляет собой довольно приятную программу просмотра.

Предположим что взвесив все "за" и "против", вы решили повременить с Unix. И, теперь, для того, чтобы разместить информацию своей компании в Мировой Паутине (WWW - World Wide Web), вам надо придумать как извернуться, чтобы запустить сервер на платформе пресловутого ПК. На сегодняшний день задача не из самых сложных, поскольку вот уже некоторое время существуют продукты, управляющие содержанием узлов паутины, работают с разметкой документов Web, предоставляя пользователям Internet принятый в Web Протокол Передачи Гипертекста (HTTP - Hyper Text Transfer Protocol). Новые инструменты работают на обыкновенных, управляемых мышью ПК. Основной платформой, по всей видимости, может стать Windows NT компании Microsoft. Большинство продуктов будут работать также и на платформе Windows 95, хотя (как и большинство новых продуктов для Internet) этот продукт все еще находится на стадии бета-тестирования. Небольшое число продуктов (в частности инструментальные средства разметки текста) работают под Windows и, кроме того, имеется по крайней мере одна интересная разработка в мире OS/2, которая передает Паутине возможности Warp.

ВОЗЬМИТЕ НА ЗАМЕТКУ

Поскольку центральным вопросом любой дискуссии в Паутине являются документы, давайте начнем с инструментальных средств разметки текста. Задача заключается в следующем: надо взять обычный текст и "разметить его", используя язык HTML (Hypertext Markup Language - Язык Разметки Гипертекста). Это может быть выполнено одним из двух способов. Первый способ: подготовить текст самому, используя известный текстовый процессор, и затем конвертировать его в HTML. Второй - использовать редактор, который позволяет прямо вставлять в текст теги разметки. Первый способ хорош своей простотой, - вам не надо знать ничего об HTML. Сильной стороной второго способа является большие возможности управления, - конверторы в HTML просто не имеют средств для обработки некоторых тонких мест.

С точки зрения возможностей "делать деньги" подход, основанный на конвертации, может никогда не найти своей рыночной ниши. Два основных поставщика текстовых процессоров почти даром предоставляют заготовки, которые позволяют превратить обычные документы в копии на HTML. Таким образом, HTML становится скорее одной из возможностей текстового процессора, чем специализированной задачей конвертации.

Первым из таких инструментов с заготовками, предназначенными для WWW, является Internet Assistant компании Microsoft. Он работает над Word for Windows 6.0a. Правда, обычный 6.0 не будет функционировать без пакета исправлений для модернизации до версии 6.0a. Впрочем, это не проблема, поскольку пакет исправлений предоставляется бесплатно. Internet Assistant является интересным продуктом по многим причинам, достаточно сказать, что его можно использовать и в качестве программы просмотра.

Теоретически, достаточно ввести документ, как вы это обычно и делаете, затем, когда работа закончена, сохранить его как документ HTML. Но на практике выясняется, что в силу инерции, трудно отказаться от привычных методов подготовки традиционного печатного документа. Например, вы привыкли выполнять рутинные операции по выделению заголовка, подсветив его и потом увеличив размер выделенного текста. А вместо этого, используя Internet Assistant, вам надо всего лишь приписать выделенный текст к определенному стилю заголовка. Подобная несложная операция приведет и к увеличению размера текста, и пометит функцию этого текста как содержание, которое должно выступать в качестве заголовка.

Если вы достаточно дотошный и законопослушный пользователь Word for Windows, вы в любом случае используете стили для пометки ваших заголовков, поскольку этот прием позволяет сразу готовить все заголовки в документе в расчете на то, что потребуется изменить их внешний вид. В случае использования ассистента HTML, Microsoft выполняет для вас такую подготовку путем вставки соответствующего тега заголовка HTML до и после текста, представленного в заданном стиле.

ПРИЯТНЫЙ И РАЗДРАЖАЮЩИЙ

Internet Assistant ловко справляется с рядом второстепенных повторяющихся препятствий, которые встречаются при подготовке документа HTML. К примеру, он автоматически вставляет метки конца параграфа, которые требует HTML. Это позволяет переключиться в режим просмотра и проверять гипертекстовые связи по мере их добавления, в то время как во всех других инструментальных средствах разметки вам приходится использовать отдельную программу просмотра и перезагружать страницу каждый раз, когда производится (или сохраняется) изменение.

С другой стороны, использование Assistant в качестве программы просмотра может рассматриваться только как пробное испытание. Этот продукт не помогает в некоторых распространенных случаях использования HTML. Например, в нем не используется модификатор ALIGN=TOP для размещения текста непосредственно над изображением (это не позволит вам кодировать документ таким способом, если только не открыть соответствующие теги HTML и не отредактировать их вручную). В Assistant также не почитаются коды "улучшения" Netscape, являющиеся фактическим стандартом среди наиболее симпатичных узлов Паутины в Internet.

ИДЕАЛЬНЫЙ ИЗДАТЕЛЬ

Для реализации подобных функций разметки компания Novell готовит свое приложение к WordPerfect. Программа Internet Publisher for Windows, бесплатное приложение к WordPerfect 6.1, является частью более широкой инициативы по поддержке работ, связанных с генерацией документов на Стандартном Всеобщем Языке Разметки (SGML - Standard Generalized Markup Language). В этом году Novell собирается выпустить издание WordPerfect 6.1 SGML, с появлением которого HTML станет только одним из нескольких возможных вариантов SGML, используемых для редактирования только как HTML. Конвертация в формат WordPerfect, а затем обратно не потребуется. Это логичный подход, поскольку HTML может рассматриваться как подмножество SGML.

Вместо того, чтобы предлагать прямую поддержку просмотра, Novell собирается связать Internet Publisher с Netscape Navigator. Эта версия Navigator будет включать интегрированные программы просмотра WordPerfect и Envoy, что даст возможность издателям WWW обойтись без своего вклада в рынок HTML при работе с пользователями, которые уже имеют такие программы просмотра. Novell будет также предлагать компакт-диск Internet Publisher Pro, объединяющий Publisher с программным обеспечением доступа к Internet по коммутируемым линиям связи, заимствованным из продукта LAN Workplace.

Имеется также горстка бесплатных инструментальных средств для разметки документов HTML в среде Windows. По крайней мере два поставщика предлагают упрощенные бесплатные версии одновременно с версиями "Pro" в расчете на то, что покупатели купят последнюю по причине наличия поддержки дополнительных возможностей, таких, например, как проверка правописания. (Думается, даже мало-мальски знакомого с WWW не надо убеждать в том, что проверяющие правописание версии пока не набрали силу).

Версия "на прокат" программы HoTMetal Pro1.0 компании SoftQuad (Toronto) является по своей технологии возможно наиболее близкой к отдельно стоящим редакторам. Среди других возможностей она предоставляет фильтр для импорта файлов, который в процессе своей работы исправляет ошибки HTML, а также функцию ратификации, гарантирующую отсутствие ошибок в окончательных версиях документов. Возможно, наиболее приятным свойством этой программы (которым, мы можем только надеяться, будут обладать все редакторы в будущем) является команда, заменяющая локальные, находящиеся на жестком диске URL (Universal Resource Locator - Универсальный Локатор Ресурсов) в "горячих" связях, на действительные, находящиеся на сервере Web URL уровня HTTP. Кроме того, она имеет контроль правописания и тезаурус, отсутствующие в бесплатной версии.

Продукт компании Brooklyn North Software (Bedford, Nova Scotia) под названием Works обеспечивает среду Windows с ясным Множественным Интерфейсом Документов (MDI - Multiple Document Interface), в котором интенсивно используются инструментальные меню для автоматической вставки тегов (при таком подходе достаточно выбрать нужные вам теги). Предусмотрен также интерфейс для вставки URL горячих связей. И снова, имеется бесплатная версия, обеспечивающая вам минимальные возможности, и расширенная версия, стоимость которой за 99 долларов.

Компания Nice Technologies (Capitola, CA) недавно усовершенствовала свой редактор Tag Wizard SGML, настроив его на разметку документов WWW. Окончательный продукт, названный Web Wizard, продается за 179 долларов, причем версия для оценки продукта доступна через Internet. Рэнделл Старк, вице-президент по разработкам компании Nice, уверен, что его команда приобрела достаточный опыт по продукции SGML, и теперь идти в ногу с разработками HTML для Nice не так уж трудно. Например, Эрик ван Хервинен, автор базового учебника "Практический SGML", написал программу грамматического разбора, которая лежит в основе линии продуктов Nice. Старк отмечает, что в то время как многие продукты HTML жестко ориентированы на текущий стандарт HTML, продукт Web Wizard полагается на определение типа документа SGML (DTD - document type definition). Очевидно, что подобная ориентация при изменении DTD позволяет с ходу менять версии HTML, тем самым существенно облегчая жизнь пользователям Internet.

ПОДАЙТЕ ЕГО НА СТОЛ

После того, как вы написали один или два документа HTML, вам необходимо скопировать эти документы в соответствующие каталоги на компьютер, на котором работает Web-сервер (часто называемый HTTPD по имени демона HyperText Transfer Protocol Daemon). До недавнего времени оригинальные Web-серверы писались исключительно для Unix, теперь же появилось несколько версий и для ПК.

Главной новой возможностью - и в общем достаточно привлекательной для некоторых пользователей - является Windows HTTPD. Автор программы - Роберт Денни, экс-президент компании Alisa Systems (Pasadena, CA), (увлекшись Web, он покинул компанию в конце прошлого года). Windows HTTPD - бесплатная программа для загрузки по сети. Регистрационный взнос, - на случай если вы решите использовать продукт в коммерческих целях, - 99 долларов.

Windows HTTPD, загруженная по сети как архивированный (zipped) файл, распаковывается в ветвистое дерево каталогов, которое сопровождается хорошим файлом инструкций README для создания пространства на диске C:. Если вы загрузите программу на C: и разместите в каталоге HTTPD ("Это еще не все" - предостерегает Денни), она полностью готова для начала работы. Вы запускаете свой согласованный с Winsock стек, затем выполняете HTTPD.EXE, и после короткого всплеска изображения на экране ничего не остается кроме безобидной пиктограммы (иконки) для индикации того, что процесс пошел.

Когда происходит обращение к серверу, текст под пиктограммой меняется для отображения информации о количестве открытых используемых сокетов. Пакет обладает удивительными возможностями при обработке запросов, поступающих от множества пользователей. Компьютер с процессором Pentium, работающий под управлением Windows, "может заполнить линию T1 задолго до того, как захлебнется сама машина", - говорит Денни.

СТЕКИ ПРОТОКОЛОВ: СРАВНИТЕЛЬНЫЙ АНАЛИЗ WINDOWS

По словам Денни проблема не в том, что для большинства пользователей обработка оказывается слишком медленной, а в том, что стеки TCP/IP для Windows вынуждены решать многочисленные задачи, определяющиеся характером трафика, который программы просмотра Web помещают в стек протокола сервера. Автор Windows HTTPD делает упор на то, что протокол HTTP существенно отличается от любых других протоколов, использующих TCP, и это отличие состоит в том, что для программ просмотра разорванные соединения являются нормой жизни. "Во время просмотра, когда текущая страница все еще загружается по сети, вы, увидев интересующую вас связь, просто подводите к ней курсор и нажимаете кнопку на мыши. Это приводит к скорострельной последовательности переустановок соединений".

"Подобные переустановки могут возникнуть сразу после того, как соединение начало открываться. Переустановка происходит в тот момент, когда вы все еще находитесь в процессе установки соединения и большинство пакетов [Windows] TCP бесстрашно продолжают работать". В результате стек закрывает прослушиваемый сокет (обычно сокет порта 80, получающий поступающие запросы HTTP от программ просмотра). Если это случилось, "сервер все еще продолжает нормально работать, но он отрезан от остального мира", - говорит Денни.

Картина меняется, если вы переходите на 32-разрядную версию NT или Windows 95. По мнению Денни, в случае NT его сервер, продаваемый как часть пакета WebSite, который разрабатывает компания O"Reilly and Associates (Sebastapol, CA), имеет очевидное преимущество по соотношению цена/производительность над сравнимыми по стоимости решениями Unix. Рассмотрим пример, - развивает эту тему автор Windows HTTPD, - дешевая рабочая станция SPARC стоит 6000 долларов. За эту цену я могу приобрести ПК с четырьмя 486-ми процессорами. Мой сервер многопотоковый (multithreaded), и работа может расщепляться на потоки, выполняющиеся на разных процессорах. Операция создания нового потока, грубо говоря, дешевая, а операция создания нового процесса - довольно дорогая. К тому же процесс обычно связан с отдельным процессором. Поставьте рядом эти две машины, и сервер NT побьет сервер Unix".

Денни - не единственный человек, агитирующий за NT. Бет Франк, возглавляющая в настоящее время в NCSA усилия по разработке сервера NT, заявляет, что "поскольку NT имеет более богатый интерфейс сокетов по сравнению с Unix, это может позволить создать более эффективный сервер".

Другое предложение для NT исходит из Европейского Академического центра Microsoft Windows NT (EMWAC - European Microsoft Windows NT Academic Center), расположенного в Эдинбургском университете в Шотландии. Копия сервера EMWAC доступна для загрузки по сети; более полная версия поставляется академическим организациям как Профессиональный Web-сервер 2.0 (Professional Web Server 2.0). Дополнительные возможности, заложенные в профессиональной версии, включают аутентикацию, базу данных для управления пользователями и группами пользователей (которые доступны через интерфейс панели управления), а также "виртуальные пути", посредством которых сервер в каждый момент времени может обслуживать файлы данных сразу из нескольких деревьев каталогов (клиент программы просмотра видит только одно иерархическое дерево).

Сервер EMWAC, - результат совместной работы компании Process Software (Framingham, MA) и EMWAC, - появился также и в Соединенных Штатах. Используя базовое программное обеспечение NT Web-сервера, Process Software разработала коммерческий Web-сервер, включающий поддержку бизнес-транзакций через Internet. Версия компании Process Software имеет стартовую цену 1995 долларов и называется Purveyor.

Компания Evanston, Ameritech Library Services, основанная на IL и являющаяся поставщиком систем автоматизации библиотек, расширила возможности NT-сервера, позволив использовать свой продукт NetPublisher для работы не только с World Wide Web, но и с клиентами gopher и Z39.50. Комбинация WWW и gopher давно встречается в мире Unix, но только ПК-сервер от Ameritech предоставляет подобные дополнительные возможности. Z39.50 - стандартный но мало известный протокол обмена между клиентом и сервером баз данных, для которого Ameritech (затем NOTIS Systems) стала первым коммерческим поставщиком.

В процессе работы с NetPublisher по мере прохода по стандартным заготовкам вам даются подсказки. Заполняя эти заготовки, вы сообщаете серверу информацию, необходимую ему для подготовки и распределения данных в качественных версиях всех трех протоколов.

ПОД НОВЫМ УПРАВЛЕНИЕМ

Подготовку Web-сервера с правильно созданными документами HTML для выхода в мировые программы просмотра можно считать самой трудоемкой частью работы, но если узел вашей Паутины действительно полностью занят издательским бизнесом, ряд вопросов управления проявится почти одновременно с вводом сервера в эксплуатацию.

Чем больше основным направлением вашего бизнеса становится издательская деятельность в Web, тем чаще вы будете сталкиваться с необходимостью плавной миграции документов с их внутреннего механизма хранения (т.е. большого дисковода, на котором хранятся все эти файлы текстового процессора, составляющие внутренний архив учреждения) на узел Паутины.

Если вы работаете в среде Lotus Notes, проблемы могут закончиться прежде, чем они начнутся. С помощью своего нового продукта InterNotes, Lotus (Cambridge, MA), предоставляет фоновый процесс, который выполняется на сервере Notes и конвертирует базы данных Note в формат HTML. В настоящее время Lotus рекомендует использовать свое программное обеспечение на платформе NT, хотя оно будет работать на любой платформе с сервером Notes.

Процесс InterNotes просматривает базы данных Notes, выбранные администратором, и конвертирует документы, хранящиеся в выбранных базах данных, в документы формата HTML. Документы HTML помещаются затем на Web-сервер (Lotus рекомендует сервер EMWAC), и становятся доступными для всего мира. В общем, вы получаете сервер Notes, работающий на одной машине, и Web-сервер, работающий на другой, со специальным "брандмауэром" (firewall) Internet между ними.

Конечно, не каждый захочет перемешивать Notes с картинками, поэтому для организации таких узлов имеются и другие инструментальные средства. Например, пакет WebSite поставляется вместе со специальным инструментарием, с помощью которого могут быть решены определенные аспекты задач управления. Основной инструмент управления, связанный с WebSite, называется Web-View. Он обеспечивает древовидное отображение документов и связей на вашем сервере вместе с пиктограммами типа файла, состояния доступа и разорванных связей; графический редактор для улучшения изображений в документах Web; "маги" (wizards), автоматически создающие общие Web-документы; кнопку поиска - средство указания, позволяющее пользователям производить поиск терминов на вашем сервере; и множество окон для просмотра нескольких узлов Паутины одновременно. Что это дает в первую очередь? Вы можете быстро пройти по вашей Паутине и найти любую связь, для которой потеряна синхронизация и которая больше никуда не ведет.

Кроме Lotus, наиболее серьезным претендентом на на зарождающемся рынке управления Web является компания Interleaf (Waltham, MA), разрабатывающая Windows-версию своего, основанного в настоящее время на Unix, продукта Cyberleaf 1.0. Внешне Cyberleaf выглядит как инструмент для автоматической конвертации в страницы HTML-документов, написанных в стандартных прикладных пакетах, таких как PageMaker и Microsoft Word. Но, кроме этого, Cyberleaf проходит длинный путь в направлении создания полной производственной среды для Web, в том числе и инструментов для ускорения процесса внутреннего связывания документов в Паутине, управления множеством Паутин и пошаговой модернизации Паутин без нарушения внутренних связей.

Продукт имеет несколько привлекательных особенностей, одна из них - встроенные инструменты для преобразования хранящейся внутри документов графики в рисунки величиной с ноготь. Загрузка картинки размером с почтовую марку происходит намного быстрее, чем загрузка полномасштабной версии, но необходимость выхода за пределы вашей среды редактирования для создания рисунков размером с тот же ноготь неприятна. Паутины, которые вы создаете с помощью Cyberleaf, препятствуют будущему редактированию, даже если вы вводите всего лишь несколько новых документов.

ПЛЕТЕНИЕ ПАУТИНЫ С ПОМОЩЬЮ OS/2

Единственное предложение для OS/2 в группе инструментального программного обеспечения Web, нацелено на создание полного, объектно-ориентированного решения. SpHyDir (PC Lube and Tune, New Haven, CT) представляет собой прикладную программу, написанную на VX-Rexx, и разработанную для имитации внешнего вида и ощущения рабочего места OS/2 (это прикладная программа, а не дополнение Workplace к DLL).

Плюс к этому существует реализация VX-Rexx Web-сервера. Среда SpHyDir отличается от других выше упомянутых инструментов тем, что позволяет представить все что угодно, включая вполне "приземленные" компоненты страницы HTML (каждый элемент в "расстрельном списке", например), в виде захватываемых (draggable) и перемещаемых (droppable) объектов, которые размещены в представляющей документ древовидной иерархии.

Остается еще узнать, какая помощь по управлению потребуется администраторам узлов Паутины со стороны программного обеспечения. Но из дискуссии с несколькими выдающимися мастерами Web ясно, что работоспособность узла Паутины поддерживается пока ручными, старомодными средствами. Джон Лабовитц, менеджер по техническому обслуживанию издания Global Network Navigator Website компании O"Reilly and Associates, утверждает, что имеющиеся в настоящее время механизмы управления в большинстве узлов Паутины включают лишь простое копирование каталогов и трудоемкий двойной контроль целостности связей. Он добавляет: "Мы используем действительно стандартные инструменты Unix. Чаще всего люди работают с редакторами vi и emacs для ручного кодирования документов. Для проведения контроля синтаксиса HTML мы пользуемся некоторыми свободно распространяемыми продуктами".

Лабовитц подчеркивает, что сами серверы HTTP могут помочь в управлении процессами издания WWW. "Если вы внимательно посмотрите на спецификацию HTTP, - поясняет он, - то найдете все виды возможностей, которые в существующих серверах в должной степени до сих пор не оценены. Реализация этих возможностей - дело ближайшего будущего". Лабовитц представляет себе сервер, который позволяет использовать клиентскую часть для проверки приходящих и уходящих страниц: "Если вы заново проверяете страницу, сервер знает, что с ней делать, он может даже "произнести" фразу типа "не забудь установить соединение" или что-то похожее. Чтобы это произошло, в спецификацию ничего добавлять не надо".

Таким образом, управление WWW вскоре станет подчиняться принципу "сверху вниз". В любом случае придется признать, что арена Web-издательства расширяется, становится графической и приобретает серьезные очертания. Поставщики предпринимают решительные действия, пытаясь обеспечить всеобщую доступность и простоту использования. Как сказал Роберт Денни: "Я хочу придумать для Web нечто в высшей степени дерзкое. Я хочу превратить ее из системы, рассчитанной на мэйнфреймы и терминалы, в настоящую одноранговую среду. Если мне удастся сделать так, чтобы сервер Web можно было поместить в любое место, где есть программа просмотра Web, я буду счастлив".


Роберт Ричардсон (robert@fiction.com) - независимый писатель и консультант по компьютерным технологиям из Конкорда, Массачусетс. Его руководство по ресурсам World Wide Web в ближайшее время будет опубликовано Sybex Publishing.