Стив Кэнингхэм,
ACM SIGGRAPH
cunningham@siggraph.org

Возможности электронных изданий
Свойства технических публикаций
Adobe Acrobat
HTML и программы просмотра Web
Создание электронных публикаций
Создание Acrobat документов
Создание HTML документов
Разработка изданий для Web
Доставка публикаций потребителям
Доставка на CD-ROM
Доставка по сети
Смешанная доставка
Заключение
Литература

Электронные издания являются сегодня одним из самых быстроразвивающихся приложений, широко использующих потенциал машинной графики по представлению информации в электронной форме. В данной статье, продолжающей серию работ по теме электронных публикаций [1] исследуются возможности и проблемы, связанные с подобным типом изданий, приводится оценка различных вариантов решений. Основные вопросы - формат для содержания и средства по созданию содержания в этом формате, а также средства, используемые для доставки информации к потребителю. Рассматриваются два основных издательских формата представления научно-технической информации и два средства доставки этого содержания.

Электронные издания сегодня стали широко применять для множества различных приложений и тому имеется ряд важных причин. Традиционные бумажные издания высоки по стоимости и во многих случаях имеют ограниченные возможности из-за особенностей печати на твердых копиях. Электронные издания позволяют обойти некоторые издержки производства и распространения, а также избежать ограничения по печати. Издержки производства можно легко посчитать. Цена на бумагу, особенно высокого качества для цветной печати, в последнее время возрастала на 20% в год, да и заказы на доставку такой бумаги в больших объемах требуют для своего выполнения довольно длительного времени. При использовании цветной печати, как это должно быть в машинной графике (МГ), необходимо включить затраты на использование соответствующих печатных станков и другого оборудования, цены на которое так высоки, что большинство книгоиздателей стараются включать цвет довольно умеренно. Если вы издали какую-то партию, вам необходимо доставить ее до потребителей или хранить до дальнейшего распространения, что очень дорого для больших объемов из-за больших затрат по отправке и хранению на складе. И еще один момент. Если ваше издание пользуется повышенным спросом, вам необходимо переиздать его, а значит опять пройти весь круг затрат по переизданию.

Другие недостатки печати становятся очевидны, если посмотреть какой тип информации мы хотели бы передать нашим пользователям. Помимо слов в МГ существует другие возможности - для представления результатов вашей графической работы, необходимо прежде всего напечатать изображения. Для воспроизведения изображений при печати, приходится идти на множество компромиссов, мешающих точно воспроизвести каждуюе картинку. Хотелось бы издавать анимационные цепочки, но это совершенно невозможно при печати, если не принимать во внимание "книжки-раскладушки" с изображением на каждой странице. Во многих областях науки и техники, где МГ используется в качестве инструментального средства, хорошо было бы издавать интерактивные графические имитационные модели с тем, чтобы читатель мог поэкспериментировать с обсуждаемыми концепциями. Наконец, для презентации некоторых научно - технических результатов бывает необходимо представить читателю первоначальные массивы данных с тем, чтобы они самостоятельно смогли провести свои собственные исследования для подтверждения или расширения результатов работы автора. Каждая из этих причин может быть доводом в пользу электронных публикаций.

Возможности электронных изданий

Сегодня заметен рост новых типов технологий, позволяющих судить об электронных изданиях как о развивающейся отрасли. Во первых, это совокупность технологий для создания, хранения, объединения отдельных видов информации и разработки реальных электронных изданий. Во вторых - это набор средств для доставки содержания пользователям.

Технологии создания, хранения и воспроизведения отдельных частей документа обычно различаются - каждая обязана решать свои специфические вопросы.

  • Текст: стандарты кодирования ASCII и Unicode; LZW сжатие.
  • Изображения: JPEG, GIF, TIFF, PICT, TGA кодирование для цветных изображений; CCITT GROUP IV и JBIG для черно-белых изображений; JPEG, RLE, LZW сжатие.
  • Размещение текста и изображения: PostScript и PDF.
  • Компоненты текста: SGML и HTML.
  • Цифровые картинки: QuickTime, Video для Windows, MPEG кодирование; Cinepak и Indeo сжатие.
  • Звук: AIFF, WAV, QuickTime, MIDI кодирование; ADPCM сжатие.
  • Моделирование: VRML.
  • Отбор применяемых технологий из этого перечня осуществляется после выбора авторской системы - основного средства для компоновки законченных документов из различных, отдельно созданных частей. Однако, авторские системы часто не поспевают за развитием технологий. Для некоторых видов электронных изданий, требующих высокого уровня взаимодействия с пользователем и динамического представления информации очень трудно найти средства, позволяющие автору стандартным образом использовать все виды компонентов. К счастью, технические издания, в отличие от используемых для развлечений, не так требовательны, и для них существуют приемлемые средства для интеграции необходимых частей содержания.

    Фактически, для доставки законченных изданий к потребителю, можно выделить два основных средства: CD-ROM и сети. Запущенная в начале этого года система Digital Video Disc (DVD) будет проигрывать CD-ROM аналогично цифровому кино, что приведет к дальнейшему распространению устройств CD-ROM, которых к 1997 будет использоваться более 22 млн. США пока занимает лидирующее первенство в использовании CD-ROM, однако, в Европе распространение дисков развивается параллельно кривой роста в США с отставанием только в 2 года. Мир, как бы взял обязательство перед CD-ROM: ни одного продаваемого компьютера без установки на нем CD-ROM.

    Подобно CD-ROM, так - же быстро развиваются компьютерные сети и сейчас они представляют собой необходимое средство для доставки электронных изданий. Известны данные по росту Internet (http://www.nw.com/ ): от двух сотен хостов в 1981 до 4 тыс. в 1986, 500 тыс. в 1991 и 12 млн. в середине 1996. Так - же быстро растет количество пользователей Internet и, по некоторым прогнозам, к 2000 г. число их достигнет 200 млн. человек. Самой представительной страной в Internet является США, которая по использованию Internet на душу населения может быть сравнима только с Австралией и Новой Зеландией. Остальные страны, особенно Европа, развиваются по той же кривой роста, что и США, только Япония располагает менее 2% от всего количества Internet хостов, очевидно, потому что не имеет государственных учреждений и программ по распространению сетей. Развитие Internet привело к бурному росту трафика, что затрудняет распространение больших документов, и эта проблема будет еще острее по мере расширения количества пользователей. Пока скорости передачи данных слишком низки для всех классов пользователей, то слишком рискованно основывать крупное издательство на сети, особенно, если оно включает интерактивные публикации с картинками высокого разрешения и видео. Однако, имеет прямой смысл использовать Internet для распространения технических публикаций, где пользователю необходимо время только на выгрузку полного документа к себе на компьютер.

    В качестве примера возможностей, предоставляемых электронными изданиями, возьмем цифровую библиотеку. В традиционной библиотеке для читателей собираются коллекции материалов, предоставляются каталоги и указатели к этим коллекциям, хранятся исторические записи по различным областям, а также предлагается помощь для поиска специальных материалов. Перед цифровыми библиотеками стоят те же цели, но они имеют постоянный доступ к коллекциям со всего мира, новым форматам документов и новым технологиям, динамическим каталогам, указателям, предоставляя также помощь экспертов в интерактивном режиме. Обладая такими возможностями цифровые библиотеки расширяют традиционное понятие коллекция. Новые библиотеки включают преобразованные в цифровую форму документы из традиционных библиотек, официальные и неофициальные отчеты, мультимедиа документы и наборы данных, позволяющие пользователям использовать их стандартными способами посредством мощных инструментальных средств. Библиотеки значительно упрощают, но с другой стороны расширяют учебный процесс, а также являются проводником к знаниям для огромного количества читателей, которое не смогла бы вместить ни одна традиционная библиотека в мире.

    Свойства технических публикаций

    Технические публикации несколько отличаются от других типов изданий, существующих в электронном мире. Они сильно ориентированы на текст и для усиления и наглядности представления используют такие типы содержания как изображения, движущиеся картинки, звук и имитационные модели текста. Они отличаются от таких интерактивно управляемых продуктов как видеоигры, мультимедиа развлечения и некоторые обучающие электронные издания. Можно выделить несколько основных свойств, характерных для конечных электронных версий технических публикаций:

  • они должны быть, по крайней мере, не ниже по качеству, чем печатные версии публикаций,
  • они должны быстро создаваться, но при этом недорого стоить,
  • они должны быть читабельны на всех типах обычно используемых компьютеров,
  • они должны содержать, по крайней мере, столько же информации, сколько могли бы включать печатные версии публикаций,
  • они должны обладать возможностью включать все способы представления информации,
  • они должны быть совместимы с любыми средствами доставки.
  • Необходимо помнить об этих характеристиках при выборе авторских систем и форматов документов для построения научно - технических электронных изданий. Сегодня для подготовки таких публикаций можно выделить две наилучшие возможности: создание документов и систем доставки с помощью Adobe Acrobate, а также с помощью HTML и средств доставки с помощью WWW.

    Adobe Acrobat

    Система для электронных документов Acrobat компании Adobe Systems появилась в 1993 г. и оказала значительное влияние на способы создания и распространения электронных публикаций с исходной текстовой основой. Acrobat строится по технологии PostScript, но некоторые внутренние изменения файлов Acrobat, фактически, улучшили довольно свободную архитектуру PostScript, результатом чего стала высокое качество подготовки публикаций. Это не так важно для технических изданий но этим не стоит пренебрегать. Среди преимуществ можно выделить простое включение рисунков, диаграмм, таблиц и уравнений.

    С помощью ряда удобно расположенных кнопок пользователь может выбрать просмотр текста или маленьких страниц для сопровождения документа; изменить масштаб изображения текста или цифр; настроить последовательный просмотр страниц или установить порядок для просмотра необходимых страниц; выполнить ссылку для перемещения по документу или просмотреть сопровождающий документ; выбрать текст из документа для его вставки в другой документ или, наконец, провести поиск по словам в документе. Кроме того, так как Acrobat разработан на базе PostScript, можно распечатать любой Acrobat файл на любом PostScript принтере, включая всю палитру цветов. Система Acrobat была выбрана в качестве основы для электронной издательской программы ACM SIGGRAPH в 1993, исходя из предварительного просмотра системы еще до ее выпуска. Первоначально мы выбрали систему за ее возможность обеспечения точных и высококачественных экранных версий печатных страниц с внутренними гиперсвязями, поиска и копирования. Но со временем мы узнавали о все более развитых возможностях: включении встроенных движущихся картинок, наличие гиперсвязи к другим документам в Acrobat и Web документам во всем WWW. Кроме того, версия 3.0 Acrobat совместима с Netscape Navigator и другими программами просмотра Web, что позволяет просматривать документы в Acrobat в окне этих программ. Acrobat полностью доказал, что является в высшей степени развитой издательской системой.

    HTML и программы просмотра Web

    Язык гипертекстовой разметки HTML - это тегово-текстовая система, позволяющая автору вставлять теги в текст для описания устройства части документа. Файлы HTML отображаются посредством программы просмотра Web - приложения, идентифицирующего теги и выполняющего необходимое отображение. Теги в HTML позволяют включать различные уровни текста, задавать шрифты и размеры, а также устанавливать связи с изображениями, хранящимися вне рамок текста. Одной из проблем, связанных со средой Web, является тот факт, что набор допускаемых тегов не постоянен для различных программ просмотра и непрерывно расширяется для каждой отдельной программы. Несмотря на то, что стандарты HTML находятся в стадии разработки данная область развивается и меняется настолько быстро, что угнаться за ней очень сложно. Основная проблема, связанная с Web, фактически заключается в том, что разработчики добавляют все новые теги и функции HTML с целью сделать свои программы просмотра отличными от других вместо создания наилучшего возможного инструмента для разработки публикаций.

    Программы просмотра Web обладают прекрасными возможностями распознавания типов файлов и предоставления соответствующих приложений для воспроизведения выгруженного файла из сети Web на домашних системах. Большинство программ просмотра интегрируют файловые считывающие устройства таким образом, чтобы файл воспроизводился непосредственно в окне программы просмотра. Большинство программ просмотра воспроизводит сегодня встроенные движущиеся картинки, а некоторые из них обладают способностью открывать окно Acrobat в своем собственном окне для воспроизведения документа в Acrobat. По крайней мере одна программа воспроизводит VRML документы.

    Фактически, подобная интеграция все возрастающих возможностей на различных хост компьютерах является одним из главных преимуществ Web, разрушающих различия между системами, которые были основным камнем преткновения долгие годы. С точки зрения пользователя, при использовании HTML публикаций возникают две проблемы: навигация и печать. Вследствие того, что HTML публикации создаются из множества различных компонентов, пользователь легко может потерять путь их размещения в огромном множестве файлов. На помощь приходят такие функции как сохранение истории полного сеанса пользователя, которыми располагают большинство программ просмотра. Также очень полезно, если в публикации каждый раздел включает небольшую таблицу с содержанием всей публикации и указатель, в каком из разделов находится пользователь; тогда вопрос о текущем местонахождении отпадает.

    Создание электронных публикаций

    Для издания бумажных публикаций задействована сравнительно небольшая команда: редакторы, корректоры, сортировщики и печатники. С новыми средствами представления информации все это присутствует в электронных публикациях, но необходимы еще специалисты, имеющие опыт в создании и сканировании цифровых изображений, а также изготовители дисков или Web администраторы вместо печатников.

    Технологии для создания электронных публикаций также отличаются от технологий, используемых при производстве печатных публикаций. Мы должны ясно представлять разницу между электронной подготовкой печати, при которой материалы, необходимые для печатной публикации управляются и собираются посредством компьютера, и авторскими системами для электронных публикаций. Кроме всего прочего такие авторские системы определяют интерфейс между публикацией и пользователем, а также устанавливают функциональные возможности публикации - способы, посредством которых происходит взаимодействие и отображение. Авторские системы гораздо больше похожи на среды программирования, так как автор или разработчик публикации должен определять компоненты интерфейса, отклики на результаты и операции, которые будет выполнять публикация [2].

    Для публикаций Acrobat и HTML необходимы одни и те же типы компонентов и для их создания требуются одни и те же команды. Однако эти две документальные системы имеют различные авторские системы и по-разному интегрируют свои компоненты. Поэтому имеет смысл чуть более подробно поговорить о создании документов в этих двух системах.

    Создание Acrobat документов

    Так как Acrobat основана на технологии PostScript, она имеет те же преимущества при доставке документов высококачественного дизайна, что и PostScript предоставляет для компоновки страниц. Документы создаются в формате PDF (Portable Document Format), поддерживаемым многими системами подготовки изданий. Среда создания Acrobat документов включает ряд компонентов - самый верхний содержит Distiller (дистиллятор), программу, транслирующую PostScript файлы в PDF файлы. Следующий уровень включает Exchange (обмен) и Catalog (каталог). (Рис. 1). Exchange позволяет пользователю компоновать, переставлять документы, добавлять к ним разные функциональные возможности, в то время как Catalog создает индексные файлы для документов.

    Picture 2

    Рисунок 1.
    Операции при создании конечного документа в Acrobat.

    Самым нижним уровнем является Reader - программа считывания, отображающая документы для пользователя и поддерживающая функциональные возможности в документах программы Acrobat. Acrobat Reader доступна для большинства компьютерных систем, причем Adobe позволяет распространять ее бесплатно, поэтому ее легко можно поставить на CD-ROM.

    Самый простой путь создания файла Acrobat PDF - начать с PostScript файла, который с помощью программы Distiller транслируется в PDF. Пользователь должен установить различные параметры, управляющие процессом: уровень сжатия JPEG для цветных изображений или автоматический режим создания маленьких страниц. При другом способе создания PDF файлов из исходных документов используется PDFWriter, псевдо-принтер, являющийся частью продукта Exchange. Он может быть активизирован, как если бы вы печатали документ, и выдает PDF версии документов.

    Как только первоначальные PDF файлы созданы для каждой порции документа, можно использовать приложение Catalog для создания индекса для одного или более документов и приложение Exchange для помещения дополнительной структуры в файл. Это самая ответственная операция в процессе - многое, что делает электронные документы особыми, создается именно здесь. Сюда включается поддержка для просмотра, примечания, индексирование и редактирование связей. Недавно в Exchange была добавлена возможность включать движущиеся картинки и звуковые клипы в пределах Acrobat документа. Exchange также позволяет объединять документы, удалять страницы из документов или, наоборот, добавлять их, таким образом вы можете создавать документ посегментно и скомпоновать сегменты в конечный кусок. В целом, процесс создания документов в Acrobat нетрудный и требует небольшой специфической работы, за исключением работы по созданию связей и добавлению видео и звуковых клипов.

    Создание HTML документов

    HTML документы являются, главным образом, текстовыми с такими дополнительными компонентами как изображения и движущиеся картинки. Разработка HTML документов включает создание текстовой части документа с данными, связывающими все компоненты: текстовые разделы и медиа компоненты. Текст может быть создан либо автором, либо другим приложением, например, системой баз данных, возвращающей результаты запросов по базам данных в виде HTML документов.

    Теги в HTML - документах указывают как интерпретировать и представлять различные части файла, а также другие файлы, определяемые различными типами связей. HTML теги согласуются с SGML (Standard Generalized Markup Language - стандартный обобщенный язык разметки), а программы просмотра Web отображают HTML документы посредством специальных дескрипторов - DTD (Document Type Descriptors). Ключом для создания HTML документов является добавление тегов, описывающих компоненты текста и обеспечивающих детали размещения информации на экране, а также создающих связи для включения в документ таких компонентов, как цифры, движущиеся картинки и applets. Для создания подобных теговых текстов существует ряд различных средств. Основной способ - запись HTML документов в системе подготовки текстов с добавлением вручную тегов. Таким образом, чтобы блок текста представить курсивом, необходимо записать

    Italic text goes here

    или, если мы хотим сделать ссылку на включение какого-либо изображения в тот же каталог, необходимо записать

    Конечно, это трудоемко и тратится много времени, особенно для публикаций, включающих множество отдельных файлов или большое количество тегов, указывающих на стиль. Другие способы позволяют автору выбрать необходимые операции, показать результаты этих операций и автоматически вписать HTML теги, выполняющие операции. Таким образом автору необходимо выбрать блок текста, который он хочет отобразить курсивом, и он в таком виде и появится на экране, а пара тегов и будет подставлена в текст незаметно для автора. Цифры можно вставить с помощью выбора из меню строки, запрашивающей цифры. Она будет отображена посредством программы просмотра Web, а тег для нее будет включен автоматически. Этот подход стал доступен после появления инструментальных авторских средств Web. Единственная сложность в использовании подобного метода заключается в том, что количество HTML тегов растет с такой скоростью, что авторские инструментальные средства быстро устаревают. Особый интерес в технических публикациях представляет необходимость включения формул в публикации. Напрямую этого сделать в HTML нельзя - не существует возможности создания специального типа форматирования для представления формул в виде текста. Проблема с формулами будет решена, если представить формулы графически, обычно как GIF файлы, и включить их в текст. Это эффективно при отображении, но не позволяет читателю проводить поиски в уравнениях.

    Еще одним интересным компонентом в HTML публикации является апплет (applet - название является уменьшительным от приложения (app, application)). По сути дела апплет - небольшое встроенное приложение, которое можно вызвать через HTML файл. Апплеты позволяют включить в HTML файл практически любые функциональные возможности, какие только можно вообразить. В контексте создания технических публикаций полезными апплеты являются различного рода имитационные модели, использующие для объяснения точки зрения или демонстрации в теоретических вопросах когда читатель может экспериментировать с моделями.

    Обычно апплеты программируются на языке, обладающим необходимыми возможностями для встраивания их с сетевыми связями. Пока существует два основных языка для создания апплеов - Java и Visual Basic. Первый компилирует свои апплеты в машинно-независимый байтовой код, загружаемый в пользовательскую программу просмотра Web, в то время как Visual Basic applets ограничены только средой Windows. Так как оба языка требуют программирования, некоторым авторам для использования апплетов в своих публикациях необходима помощь программиста. Стоит упомянуть еще язык VRML (Virtual Reality Modeling Language) как средство для вставки в публикацию имитационных моделей, включающих элементы виртуальной реальности. Сейчас этот стандарт находится на стадии разработки, однако программы просмотра Web уже обладают всеми средствами его поддержки.

    Законченная HTML публикация состоит из ряда отдельных файлов, взаимосвязанных через теги в различных частях. Все эти файлы могут быть размещены в одном каталоге системы, например, на одном CD-ROM или на одном сервере, или могут быть разбросаны по удаленным серверам. Структура такого множества файлов для технической статьи, показана на Рис. 3. Здесь могут быть размещены один или более индексных файлов: "Оглавление" или "Авторский индекс", а каждый вход в индекс указывает на раздел, содержащий изображения и/или движущиеся картинки,вместе с подразделами. Эта структура может быть рекурсивной, так как каждый подраздел, в свою очередь, способен содержать изображения, движущиеся картинки или applets.

    Picture 3

    Рисунок 3.
    Возможная структура компонентов HTML публикаций.

    Разработка изданий для Web

    Во многих случаях HTML документы на Web достаточно примитивны по своему оформлению. Несмотря на расширение разнообразия типов отображений увеличение количества тегов и типов тегов приводит к тому, что многие возможности оказываются вне контроля автора. Например, если автор определяет раздел текста для его выделения, он не знает как текст будет выглядеть до момента его отображения; раздел может быть просто выделен, или представлен курсивом, любым другим шрифтом или другим размером. Некоторые различия даже более существенны; пользователи будут читать публикацию на системах с разными размерами экрана, в окнах разного размера, имеющих различную палитру цветов и обладающих, иногда, неадекватной интерпретацией цвета, не говоря уже о том, что программы просмотра могут не поддерживать некоторые элементы, задуманные автором. Таким образом, создание публикаций для универсальной среды становится довольно сложной задачей.

    Сейчас предпринимаются некоторые попытки по уменьшению упомянутых различий и по созданию более дружественно-настроенной среды для Web публикаций. Было объявлено о разработке стандартизованных шрифтов для программ просмотра Web - все получат возможность узнать как будет выглядеть текст пользователя при отображении. Кроме этого, существуют планы по разработке таблицы стилей с тем, чтобы автор смог создать таблицу стилей для сопровождения своей публикации, а также знал, что заголовки, выделения или другие возможности оформления будут правильно представлены. Очень важно четко представлять с какими проблемами можно столкнуться при создании HTML публикаций; эти проблемы довольно тонкие, и их легко можно проглядеть, если принять следующую установку: что я вижу на своем экране, точно то же самое увидят на своих экранах пользователи во всех уголках мира.

    Доставка публикаций потребителям

    Как уже упоминалось, существуют две основные технологии для доставки публикаций: CD-ROM и компьютерные сети. Каждая имеет свои преимущества и недостатки, но наиболее значительным достижением является тот факт, что обе эти технологии могут доставлять одновременно документов, подготовленные в Adobe Acrobat и HTML. Год назад CD-ROM мог доставлять HTML публикации, а сети не могли передавать Acrobat публикации - теперь такого различия нет. Но, в сущности, публикации на CD-ROM и в сетях различаются во многих отношениях. Взять хотя бы основную терминологию этих двух областей. Диски надо изготавливать, следовательно требуется иметь стационарное оборудование для их распространения. Публикации на сети помещаются в сеть в интерактивном режиме, что говорит о доступности ресурса. Содержание публикаций на CD-ROM фиксированы и посылаются тому, кто их заказывал, в то время как публикации в интерактивном режиме можно изменять, а их содержание доступно всем пользователям.

    Однако в случае с CD-ROM потребитель располагает физическим продуктом, который можно заказать, купить, хранить и многократно использовать без необходимости привлечения дополнительных ресурсов, например, накопителей на жестких магнитных дисках. Если содержание рассматривать в качестве долговременной величины, например, справочные материалы, CD-ROM является самым подходящим средством для таких изданий. Фиксированное содержание на CD-ROM привычно и сравнимо с содержанием книги или журнала. Пользователи прекрасно знают как работать с содержанием, включающим четкие ссылки, поэтому тратится меньше времени на "шлифовку" его представления. Однако, фиксированный характер содержания CD-ROM может иногда оказаться и недостатком. Во многих областях, включая технические, появляются новые достижения и разработки, и было бы желательно, чтобы они были отражены в публикациях. Если ваши публикации находятся в интерактивном режиме, то в любой момент можно обновить их, и читатели сразу обратят внимание на новую информацию. Поэтому, если вашим читателям необходима самая последняя информация, подходящим средством доставки будет доставка по сети.

    Доставка на CD-ROM

    Подробно о CD-ROM как средстве доставки и об издании на диске можно узнать в работе [1], поэтому остановимся на некоторых наглядных преимуществах и новых достижениях.

    Емкость. Такие цифры как мегабайты памяти и скорости передачи данных не дают наглядного представления об уникальных возможностях размещения информации на диске. Поэтому, возьмем обыкновенную книгу из 300 страниц, в среднем с 300 словами на странице и со средней длиной слова 6 символов - это 1800 байтов на странице или 540 000 байтов на книгу. На обычном CD можно разместить более 1000 таких книг в текстовом виде. Если мы расширим книгу, включив черно-белые рисунки, она будет занимать 1 Мбайт в стандартном формате системы подготовки текста - диск мог бы включить 600 таких книг. Такая же книга, полностью отформатированная в Acrobat PDF, занимает 2.4 Мбайт - на диске мы имеем 250 книг. Такая же книга занимает 20 Мбайт в PostScript - на диске 30 книг.

    Теперь посмотрим на возможности емкости диска с другой стороны, на примере цифрового видео. Объем видеоинформации, которую может включить диск, зависит от размера окна, количества кадров в секунду и коэффициента сжатия. Стандартом для работы односкоростного CD-ROM, являются картинки в кадрах размером 240 х 160 пикселей. При сжатии видео скорость будет равна 90 Кбайт/с, тогда минута видео занимает 5.4 Мбайт дискового пространства, таким образом, на диск уместиться 120 минут видео. Двухскоростное устройство может воспроизводить картинку 320 х 240, но для видео требуется 18 Мбайт дискового пространства в минуту, что дает только 36 минут для видео. Большая емкость CD-ROM дополняется его небольшими размерами и весом - диски позволяют иметь публикации все время под рукой без необходимости выделения памяти на жестком диске. Эксплуатация большой электронной справочной библиотеки на CD-ROM гораздо дешевле и продолжительнее, чем ее поддержка на жестких дисках.

    Прочность. Диск практически не изнашивается при воспроизведении, и поверхность, на которой хранится информация, трудно повредить. Пластик из поликарбоната, через который проходит лазерный луч, совершенно прозрачен и не подвержен воздействию лазерного или любого другого излучения, включая солнечный свет или ультрафиолет. Фактически, единственное, что могло бы повредить поверхности диска - царапины; этого можно легко избежать осторожным обращением, но, в принципе, царапины удаляются посредством полировки поверхности составом для ювелирных драгоценностей. Одним из достижений в использовании CD-ROM является новый формат для диска Digital Video Disc (DVD). Такие диски смогут хранить от 4.5 до 17 Гбайт информации. Первоначально они предназначались для цифрового кино на рынке развлечений, но существуют уже издательские проекты, в которых можно воспользоваться преимуществами большой емкости.

    Доставка по сети

    Доставка публикаций по сетям очень заманчива. На первый взгляд кажется, что одним из ее привлекательных факторов является цена. Если вы и ваши читатели находитесь в сети, вы не платите за количество информации, которую вам надо отправить или получить. Если вы находитесь на специальном обслуживании, например "metered network", вам потребуется заплатить некоторую сумму, не превышающую обычных почтовых расходов за письмо; но если вы не контролируете тех, кто получает ваши публикации или в случае если ее популярность очень велика вам дорого придется заплатить за распространение.

    Даже, если распространение своей публикации на сети ничего не стоит, возникают другие затраты, связанные с использованием сетей.

  • Затраты на приобретение соответствующего сервера.
  • Затраты на приобретение дополнительного оборудования, например, жестких дисков и аппаратных средств для подключения к сети.
  • Затраты по эксплуатации, замене или обновлению оборудования.
  • Начальная стоимость подключения к сети.
  • Последующие расходы за подключение к сети.
  • В дополнение к этим расходам нужно добавить стоимость создания публикаций, размещаемых в интерактивном режиме, а также стоимость поддержки текущей информации на сервере. Для этого потребуется привлечь одного или более специалистов для подготовки содержания к доставке по сети. В конце концов, мы приходим к удивительно высоким расходам на издание в интерактивном режиме, поэтому прежде, чем браться за эту работу, необходимо полностью просчитать все цены.

    Выяснив вопросы, связанные с затратами, посмотрим на возможности сетей по поддержанию серьезной издательской работы. В старое доброе время - два-три года назад в США было возможно передавать очень большие массивы данных по сетям достаточно быстро. Скорости передач были в пределах от 50 до 100 Кбайт/с. Теперь, популярность Internet сильно снизила пропускную способность на сети и скорость передачи на моем сервере редко превышает 2 Кбайт/с. Конечно, это необходимо учитывать при оценке возможностей по доставке.

    Смешанная доставка

    Часто гораздо эффективнее комбинировать в одной публикации тщательно составленную архивную информацию с новейшими данными. Таким образом можно воспользоваться преимуществами содержания большого объема на CD-ROM и быстрого доступа, а также возможностью издания в интерактивном режиме и идти в ногу со временем. Для обеспечения этих двух возможностей, издатели присматриваются к концепции продукта, соединяющего дисковую и интерактивную части. Технология для обеспечения линий с дисками может быть простой и сложной, но в контексте создания научно - технических изданий самым легким путем является включение HTML публикаций на CD-ROM, подключенный к любому Web серверу в любой точке земного шара. Когда пользователь Internet использует программу просмотра Web для чтения публикаций на диске и выбирает ссылку в публикации, она будет выполняться одинаково и в случае подключения к файлу на сети, и в случае подключения к диску. Нельзя не учитывать риск при смешанном подходе. Web серверы быстро меняются и CD-ROM, полагающийся на Web сервер, которого уже нет, совершенно бесполезен. Выбирая смешанный подход, вы берете на себя обязательства по обеспечению продолжительного обслуживания ваших пользователей со всеми вытекающими отсюда расходами на сети. Однако, некоторые издатели идут на это, например O"Reilly & Associates создали Web сервер для ознакомления с некоторыми книгами и поняли, что его необходимо рассматривать как обязательство перед читателями, способствующее поддержке роста количества публикаций.

    Заключение

    Электронные публикации пока еще многим непривычны, однако, за последние два года наметилась четкая тенденция роста их популярности, достигшей той границы, за которой бумажные издания во многих областях начнут вытесняться или будут существенно изменены. Технические публикации, вероятно, являются именно такой областью. Специалисты здесь стоят среди тех, кто имеет доступ к средствам, необходимым для чтения и использования электронных публикаций, прекрасно ощущая новые веяния, связанные с сетями. Для специалистов в научно-технических областях и HTML, и Acrobat исключительно подходят к авторским системам и системам доставки, включающим весь спектр дополнительных возможностей, делающих электронные публикации столь привлекательными.

    Выбор между авторскими системами следует делать, основываясь на следующих моментах: до какой степени для публикации важно высококачественное размещение на странице и оформление, а также до какой степени важно добавлять applets к содержанию. Acrobat гораздо мощнее в поддержке высокого уровня компоновки, а HTML предлагает доступ к applet возможностям. Еще одной характеристикой электронного издания является доставка публикаций пользователям, и здесь можно выделить два варианта: CD-ROM и сети. Предпочтение сегодня можно отдать CD-ROM из-за стабильности и низкой стоимости в отличие от нестабильности сетей и часто скрытых затрат на поддержку высоко-функционального Web сервера. Но это только на сегодняшний день.


    Литература

    [1]. Стив Кэнингхем. Электронные издания сегодня и завтра. Открытые Системы, 5, 1995. сс. 69-75.

    [2] Cunningham, Steve, and Judson Rosebush, Electronic Publishing on CD-ROM, O"Reilly & Associates, 1995

    Поделитесь материалом с коллегами и друзьями