Сеть, которую давно ждали

Научно-исследовательская лаборатория воспользовалась сетевыми технологиями для создания "библиотеки без стен"

Лисандро P. Рамос

БИБЛИОТЕЧНАЯ КАРТА
НА ПЕРВЫЙ ВЗГЛЯД
ВОЗРОЖДЕНИЕ СЕТИ КОМПАКТ-ДИСКОВ
СОКРАЩЕНИЕ ОБЪЕМА КОПИРОВАНИЯ
ДОСТОИНСТВА БАЗЫ ДАННЫХ
ЦИФРОВАЯ БИБЛИОТЕКА

В 40-х годах в Национальной лаборатории в Лос-Аламосе был осуществлен один из самых жутких прогнозов писателей-фантастов: во время II Мировой войны здесь располагался центр разработки атомного оружия.

Сегодня ученые лаборатории вновь задумали реализовать литературные фантазии - на сей раз, к счастью, в области образования. Лаборатория сделала серьезную заявку на роль создателя "библиотеки без книг" и она имеет все предпосылки для достижения успеха.

Здесь всегда работали на самом передовом техническом оборудовании, например, на суперкомпьютерах Cray Y-MP/832, а ныне она к тому же имеет статус одного из двух исследовательских центров высокопроизводительных вычислений Министерства энергетики; во многом именно этой лаборатории США обязаны своей репутацией лидера в области вычислительной техники.

БИБЛИОТЕЧНАЯ КАРТА

Программистам ли не знать про эффект бутылочного горлышка? Подобная ситуация возникает, когда информацию приходится добывать, роясь в ящиках с каталогами и блуждая по книгохранилищам. Но мало найти, надо еще и отксерокопировать! Другое дело - библиотека на CD-ROM.

Нетрудно представить, насколько сокращается время поиска информации, когда она хранится в лазерных базах данных библиографии, текстов или рисунков. Экономия времени тем заметнее, чем больший объем информации хранится в библиотеке (а в библиотеке Национальной лаборатории стоят на стеллажах более трехсот тысяч книг, 2 тысяч журнальных подшивок и по меньшей мере миллион разнообразных научных отчетов).

Все это хорошо понимал менеджер Рик Льюс, ставший инициатором движения за перевод библиотеки в электронную форму, начавшегося в 1991 с создания внутренней локальной сети. Сейчас в сеть входят Unix и NetWare-серверы с массивами данных на CD-ROM, проигрыватели CD-ROM и дисковые массивы RAID.

Рабочие станции объединяют до 80 ПК, в основном семейства PC/AT (486 и Pentium), несколько машин NeXT и Macintosh. Все машины имеют доступ через маршрутизатор Cisco Systems (San-Jose, CA) к внутренним и внешним источникам информации, электронной почте и системам подготовки текстов.

НА ПЕРВЫЙ ВЗГЛЯД

В 1990 году в библиотеке появилась первая "электронная энциклопедия" на CD-ROM, ставшая важной частью технологии поиска библиографических ссылок на автономных ПК. Автономный ПК представлял собой компьютер PC/XT и дисковод Hitachi. Позже, PC/XT заменили на PC/AT с пятью дисководами Sony для компакт-дисков.

Тогда специалисты начали задумываться и об организации сети.

Прежде всего надо было выбрать ОС. Unix, MS-DOS или Mac?

Казалось бы, поначалу все говорило в пользу Unix, поскольку основные вычислительные мощности библиотеки были сконцентрированы на Unix-машинах под IP.

Однако работники библиотеки решили выбрать MS-DOS, ибо 75% систем поиска и обработки информации Лаборатории работали под DOS, к тому же многие необходимые при исследовательской работе книги были доступны только под DOS.

В это время, терминалами лаборатории могли пользоваться сотрудники для доступа к каталогам в оперативном режиме. В 1991 и 1992 финансовых годах, когда неизбежность решения на базе MS-DOS стала очевидной, были закуплены две поставляемые "под ключ" системы CD-Net 310 компании Meridian Data (Scotts Valley, CA). Шесть общедоступных рабочих станций на ПК объединили в сеть при помощи NetWare 3.11. Файловый сервер NetWare представлял собой 486-ой компьютер с объемом оперативной памяти 6 Мбайт и частотой 33МГц с одним запоминающим устройством ESDI 320 Мбайт компании Seagate Technologies (Scotts Valley) для хранения механизмов поиска; каждый оптический сервер CD-Net - 386-ой компьютер с объемом оперативной памяти 8 Мбайт и частотой 20 МГц. Кроме того, были подключены 14 односкоростных дисководов для компакт-дисков XX-3301B SCSI фирмы Toshiba, монохромная видеоплата, дисковод для 3.5-дюймовых дискет и контроллер, а также EPROM-модификация 8-разрядного контроллера-хоста SCSI компании Western Digital. Большей частью этого оборудования могли пользоваться только сотрудники.

Рабочие станции пользователей и сотрудников лаборатории представляли собой компьютеры IBM PC/XT, AT, а также совместимые с загруженными драйверами CD-Net на базе Microsoft CD-ROM Extension и протокола IPX. Доступ в оперативном режиме к базам данных на CD-ROM и внешним каталогам через Internet осуществлялся программным обеспечением TCP/IP. Организация доступа обеспечивалась системой меню Direct Access Network под DOS.

Первым важным вкладом в создание библиотек на компакт-дисках стала разработка базы данных об индексе цитирования для Института научной информации (Institute for Scientific Information - ISI). Эта база данных считалась одной из самых важных при работе с научными журналами. 12 дисков охватывали издания с 1980 по 1991 годы.

Популярность библиотеки на компакт-дисках росла стремительно. Даже приходилось выстраиваться в очередь, дабы получить в свое распоряжение очередную рабочую станцию (как правило, это была станция на базе 486-го компьютера с частотой 33 МГц, объемом оперативной памяти 640 Кбайт и 2 Мбайт расширенной под MS-DOS 5.0 и QEMM 6.0 компании QuarterDesk). Работа сотрудников библиотеки стала значительно легче.

Их радость омрачали только два обстоятельства: во-первых, постоянная необходимость оптимизировать память ПК для загрузки сложных процедур поиска, во-вторых, случалось, что компакт-диск не читался на оптическом сервере.

В первом случае, для загрузки базы данных пользователям рабочих станций на ПК приходилось отводить 30 Кбайт оперативной памяти под резидентный драйвер CD-Net для обеспечения доступа к оптическому серверу; во втором - сотрудники библиотеки, к примеру, вручную заново вставляли диск в дисковод сервера.

Библиотека не имела соответствующих специалистов по поддержке и обратилась в группу Desktop Computing компании LANL с просьбой о проведении экспертизы локальной сети из ПК. После нескольких месяцев перезагрузки испорченных дисков, оптимизации и переоптимизации памяти рабочих станций было решено пересмотреть проект локальной сети в целом.

ВОЗРОЖДЕНИЕ СЕТИ КОМПАКТ-ДИСКОВ

В 1993 году сеть компакт-дисков, созданная по новому проекту, приобрела законченный вид, что потребовало от разработчиков немалой изобретательности. Каждый компонент прежней сети подвергся придирчивой оценке для определения возможности его использования в новом качестве. Разработчики поставили перед собой цель построить из старых и новых программных и аппаратных средств открытую систему, которую можно было бы впоследствии расширять, модифицировать, масштабировать.

Помимо 28 драйверов компакт-дисков на оптических серверах, было закуплено дополнительное программное и аппаратное обеспечение. В числе приобретений оказалась программа на базе SCSI Express NLM компании Micro Design (Winter Park, FL), которой отдали предпочтение за возможность устанавливать компакт-диски на место жестких дисков. Материнская плата EISA на базе 486-го процессора с частотой 66 МГц и объемом памяти 64 Мбайт заменила прежнюю на файловом сервере NetWare.

До изменения конфигурации файловый сервер и два оптических сервера работали независимо, теперь они оказались объединены под управлением SCSI Express NLM. Стеллажи CD-Net перемаркировали, превратив их в стеллажи SCSI Express. Установка компакт-дисков не вызвала особых затруднений, каждый из них получил свою метку тома и был зарегистрирован при помощи команд NetWare.

Таким образом, разработчики устранили обе проблемы прежней сети: освободили для пользователей рабочей станций 30 Кбайт оперативной памяти и устранили необходимость перезагружать нечитающиеся компакт-диски под CD-Net.

SCSI Express NLM дал немедленный эффект. В сети все 14 CD-ROM компакт-дисков с базой данных об индексе цитирования отображались как диски от D до Q, что не требовало дополнительной памяти. Доступ стал возможен путем выбора только одного варианта из меню, это понравилось как работникам библиотеки, так и начальству. Время отклика сократилось благодаря использованию динамической кэш-памяти NetWare (каждый установленный компакт-диск под SCSI Express обходился совсем небольшим объемом памяти при работе в выделяемом NetWare блоке памяти объемом в 64 Кбайта).

СОКРАЩЕНИЕ ОБЪЕМА КОПИРОВАНИЯ

Теперь можно было задуматься и о построении системы RAID для копирования данных с дисков для высвобождения части дисководов CD-ROM. Скопировать на магнитный носитель все 14 дисков с базой данных об индексе - это первое, что пришло в голову. Искомая система RAID должна была быть открытой, недорогой и модульной, на базе готового программного и аппаратного обеспечения. Технический персонал решил остановиться на системе RAID уровня 5: она обеспечивала и полную устойчивость к ошибкам, и максимальное использование пространства на дисках в массиве в сравнении с другими системами RAID от 85 до 93%. Система уровня 5 способна восстанавливать данные при неисправности одного диска.

Разработчики остановили выбор на реализации RAID-технологии в Paragon Disk Array Software 4.5 на базе NLM компании Chantal (San-Diego).

И вот, в декабре 1993 года появился второй файловый сервер под NetWare 3.11, RAID 5, с 16 Гбайт памяти для оперативного хранения данных с компакт-дисков. Копирование выполнялось по сетевой команде NCOPY, а также команды DOS XCOPY. Однако некоторые скрытые файлы скопировать таким образом было невозможно. Разработчики обратились в Internet, и, после анализа нескольких вариантов, выбрали утилиту MCP.EXE компании Monk Software (Santa Clara, CA).

Каждый компакт-диск с базой данных об индексе цитирования копировался в подкаталог на диске таким образом, чтобы механизм поиска распознавал каждый подкаталог как отдельный диск. После копирования всех 14 дисков объем занятой памяти на диске оказался эквивалентен только восьми CD из расчета 660 Мбайт памяти на каждом.

По мере расширения сетевых услуг возникла новая проблема - элементарная нехватка места в компьютерном зале. Пришлось приобрести стандартные шкафы для вычислительной техники и другое оборудование.

Новая конфигурация дала такие преимущества, как централизация и простота доступа. Установка серверов в стеллажи и изменение способа соединения позволили увеличить объем памяти с 16 Гбайт до 21 Гбайт.

Покончив с благоустройством, персонал библиотеки обратился, наконец, к сути дела и занялся подбором компакт-дисков. До сих пор информация на них была чисто научной, однако сотрудники решили, подчинившись веянию времени, организовать также и базу данных с коммерческой информацией для поиска партнеров лаборатории среди промышленных предприятий.

ДОСТОИНСТВА БАЗЫ ДАННЫХ

Главное, что получили ученые - это возможность нахождения информации круглосуточно все семь дней в неделю. К базе можно обращаться и в оперативном режиме, правда тогда, в основном из-за высокой стоимости оперативного соединения, потребуется помощь.

Первыми работе с базой данных обучаются сотрудники библиотеки, затем они готовят и проводят курс обучения для остальных сотрудников лаборатории. Это касается механизмов поиска, из которых сейчас используются два - SPIRS компании SilverPlatter (Norwood, MA) и OnDisk фирмы Dialog (Rockville, MD).

Еще одним достижением стало создание универсальной рабочей станции на ПК, сочетающей стандартные рабочие функции с обучением. Такая станция имеет интерфейс Windows и обеспечивает доступ к заголовкам компакт-дисков под Windows и DOS, имеет выход в электронную почту (Eudora или Lotus Notes) и в Internet - на внешние источники информации при помощи интерфейса World Wide Web.

ЦИФРОВАЯ БИБЛИОТЕКА

Разработчики из Национальной лаборатории в Лос-Аламосе целенаправленно движутся к созданию "библиотеки без стен". Рик Льюис представляет себе будущее следующим образом: "Библиотека как большое здание с полками, полными книг, - это вчерашний день. Сегодня она должна стать информационным хранилищем, не имеющим ни малейшего отношения к стеллажам с книгами". Слово "библиотека" будет означать удаленный доступ к информации, где бы она не хранилась при помощи современных компьютерных технологий. А словосочетание "цифровая библиотека" прочно войдет в жизнь.

Разработчики уже планируют поместить библиотеку на настольные ПК. Их увлекла смелая идея организовать доступ к книгам на компакт-дисках из территориальной сети LANLet, что означает возможность взаимодействия со множеством платформ и сочетание различных протоколов для работы под DOS с приложениями на компакт-дисках.


Лисандро Р. Рамос - инженер Лос-Аламосской Национальной лаборатории. С ним можно связаться через Internet по адресу /ramos@/anl.gov.