«Виртуализация» информационных источников, сопровождающая распространение технология Internet, начинает вступать в противоречие с организацией традиционных процессов человеческой деятельности.
Евгений Фаддеенков
«Виртуализация» информационных источников, сопровождающая распространение технология Internet, начинает вступать в противоречие с организацией традиционных процессов человеческой деятельности. Новое звучание получают процессы перевода традиционных источников информации в форму ресурсов Сети и придания интегрированным информационным массивам, хотя бы частично, той степени организации учета и классификации, которая присуща традиционным библиотекам. Проект «Электронная библиотека для обучения и исследований», реализуемый в Центре новых информационных технологий Новосибирского госуниверситета - одна из таких попыток.
Основываясь на открытых библиотечных стандартах, рекомендациях группы Dublin Core [1] и существующих классификационных схемах, создан механизм интеграции разнородных информационных ресурсов в единый конгломерат с унифицированными процедурами обработки и доступа.
Предоставление локальных информационных ресурсов в единое общедоступное информационное пространство - составной элемент формирования информационного общества, способный изменить многие традиционные области человеческой деятельности. При соответствующей организации этот процесс может в существенной степени повлиять на интенсивность и качество образования и научных исследований. Этого можно достичь за счет:
глобализации ресурсов, доступности всех работ, ведущихся в каком-либо направлении;
доступности часто используемой информации учебно-методического характера, т.е. формирования информационной ресурсной базы для процессов дистанционного образования;
удаленного доступа к информационным ресурсам, традиционный доступ к которым затруднен в силу особых условий хранения, доступа и др.).
Сегодня усилия многих крупнейших исследовательских организаций и фондов сосредоточены именно на проектах представления, поддержки и использования информации в Internet. Подтверждением этого могут быть исследования International Institute for Electronic Libraries Researches [2], проекты eLib [3], DeLIver[4], деятельность библиотеки конгресса США [5], крупнейших российских и зарубежных фондов: Фонд Сороса (программы «Интернет», «Автоматизация библиотек»), РФФИ, International Science Foundation (программа Digital Library Initiative [6]).
Для России этот процесс особенно важен в силу целого ряда причин. Ведущие научно-образовательные центры разделяют огромные по западным меркам расстояния, а возможности командировок, стажировок, научных обменов, обучения по программам нескольких вузов и т.д. сегодня крайне невелики. Сложившаяся сеть высших учебных заведений характеризуется большим числом относительно мелких и узкоспециализированных «академий» и «университетов». Характерная для многих случаев оторванность университетов от исследовательских работ мирового уровня, ведущихся во многих НИИ, исключает для студентов возможность использовать оперативную информацию и принимать участие в совместных работах.
Подсистемы электронной библиотеки
Электронный библиографический каталог - центральная часть любой автоматизированной библиотечной системы. Его основное назначение - ввод, модификация и поиск «библиографических описаний» - типовой (единой для библиотеки или сети библиотек) номенклатуры информации обо всех единицах хранения (каталог библиотеки конгресса США http://catalog.loc.gov, каталог OCLC http://newfirstsearch.oclc.org). Практически все такие подсистемы обеспечивают формирование «карточки» - элемента стандартного карточного каталога. Многие из них обладают возможностью представления библиографических описаний в одном из стандартов обмена библиографическими данными в машиночитаемой форме xMARC. OPAC - это электронный библиографический каталог с обеспечением открытого поиска. Сводный каталог поддерживает библиографические описания, общие для нескольких библиотек. Электронный библиографический каталог электронной библиотеки обеспечивает ввод, хранение, поиск библиографических описаний семантики xMARC с авторитетными записями и открытым набором классификаторов. Обеспечено формирование карточек в соответствии с ГОСТ.
Электронная библиотека. Подсистема электронных образов изданий электронной библиотеки позволяет вводить и описывать (в семантике Dublin Core) как сами издания, так и любые мультимедиа-материалы (звуковые и видеофрагменты, графические изображения). Обеспечивается возможность ассоциирования хранимых материалов с описаниями электронного библиографического каталога.
Тематический каталог ресурсов Internet. Использование поисковых систем влечет необходимость фильтрации результатов поиска по тематическому принципу. Это требование реализуется соотнесением любого ресурса (URL) с одной или несколькими «тематическими рубриками». Подобное соотнесение, как правило, выполняется вручную специалистами предметных областей, однако в последнее время ведутся разработки по созданию автоматизированных экспертных систем. Тематический классификатор может иметь произвольную (выработанную авторами поисковой системы) структуру и форму или быть стандартизованным. Наиболее распространены такие классификационные схемы как DDC, UDC, ББК, ГРНТИ, ВАК, УДК.
Подсистема каталогов ссылок. Предоставляет пользователям возможность самостоятельно создавать тематические каталоги ссылок, классифицируя их с помощью полного набора «универсальных атрибутов». В системе отсутствует возможность автоматической индексации сайтов - обеспечивается поиск только по уже созданным описаниям.
Серверы Web-конференций. Наряду с технологиями новостей (News), интенсивное развитие получает их аналог - Web-конференции, отличительными особенностями которых является:
хранение всего массива сообщений за всю историю существования конференции;
поиск по всему массиву;
локальность - концентрация сообщений на одном логическом сервере без возможности тиражирования;
поддержка редко изменяемой информации, ассоциированной со всей группой;
развитые механизмы управления доступом, регистрируемый круг участников.
Подсистема Web-конференций электронной библиотеки обеспечивает все перечисленные возможности (http://www.nsu.ru/elib/webconf).
Организация информации
Рис. 1. Структура классов и связей
Каждый из поддерживаемых информационных источников характеризуется индивидуальным набором атрибутов, определяемых в соответствии с существующими стандартами и рекомендациями, а также сложившейся практикой. Вместе с этим определен репозиторий всех объектов электронной библиотеки, в котором регистрируются все добавляемые ресурсы и обеспечивается унифицированная идентификация всех ресурсов электронной библиотеки как для обеспечения работоспособности информационных систем, так и для введения процедур внешнего именования ресурсов.
Разрабатываемая система обеспечивает ввод, описание, хранение и доступ к информационным источникам, каждый из которых (рис. 1), помимо своих специфических атрибутов, описывается единым набором классифицирующих признаков (универсальных атрибутов):
записи «Авторы» (семантика российской версии UNIMARC/Authorities) и классификатор отношений;
стандартные тематические классификаторы (в настоящее время реализована поддержка ГРНТИ, ББК, DDC);
ключевые слова.
Вынесение универсальных атрибутов позволило осуществлять быстрый поиск по всему информационному массиву.
При выработке состава и структуры универсальных атрибутов были учтены следующие требования.
1) Наряду с минимальной содержательной поддержкой на уровне объектов электронной библиотеки (наименование и описание), состав информации по поддерживаемому информационному источнику должен удовлетворять рекомендациям Dublin Core версий 1.0 и 1.1.
2) Семантика библиографических описаний совместно с универсальными атрибутами должна быть эквивалентна семантике RUSMARC и допускать двустороннюю конвертацию. При этом в состав универсальных атрибутов вводится вся информация, входящая в область авторитетных записей. Должно обеспечиваться формирование стандартных «Карточек» по ГОСТ 7.1-84.
Совокупность признаков, входящих в состав универсальных атрибутов может быть использована для классификации и описания новых видов информационных источников, не входящих пока в состав поддерживаемых электронных библиотек, а также может использоваться другими системами для классификации своих ресурсов.
Следует заметить, что с учетом ограничений реляционных СУБД, наиболее сложной задачей при разработке структуры данных для универсальных атрибутов стало обеспечение второго требования. Действительно, конструкция, эквивалентная по мощности описаний сетевому по своей природе языку RUSMARC в реляционной СУБД получилась бы слишком громоздкой и неэффективной. В связи с этим, было принято решение анализа вероятных состояний (описаний на языке RUSMARC) и обеспечение эффективной поддержки их на уровне СУБД. Связано это с тем, что, по сути, мощность языка RUSMARC превышает мощность возможных библиографических описаний. В качестве анализируемых образцов были выбраны разнообразные описания, подготовленные библиотекой НГУ, примеры авторитетных записей стандарта RUSMARC, и тестовые примеры, подготовленные РНБ [9].
Ресурсная база
В качестве ресурсной базы электронной библиотеки используются следующие информационные массивы:
электронный библиографический каталог библиотеки НГУ, включающий более 50 тысяч библиографических описаний, взятых из более старой системы «Библиотека» разработки МГУ.
электронные образы изданий учебно-методической литературы, выходящей в НГУ.
тематические каталоги ресурсов и Web-конференции, поддерживаемые преподавателями и сотрудниками университета.
аудио-, видео- и графические материалы в электронной форме, подготовленные Web-лабораторией Internet-центра НГУ и телевидением НГУ.
Для каждого из этих массивов была реализована собственная методика включения в состав Электронной Библиотеки.
Библиографические описания. Актуальность информации о библиографических описаниях обеспечивается тем, что электронная библиотека сама обеспечивает функции ведения электронного каталога. Информация, накопленная до ее организации в системе «Библиотека», была конвертирована в информационное хранилище Электронной Библиотеки. Этот процесс включал в себя следующие стадии:
Зрелость профессии Сергей Кузнецов Обзор майского (2000 г.) выпуска журнала Computer (Vol. 33, No. 5), IEEE Computer Society
«Алиса» в стране знаний Евгений Фаддеенков «Виртуализация» информационных источников, сопровождающая распространение технология Internet, начинает вступать в противоречие с организацией традиционных процессов человеческой деятельности.
Биометрия: будущее идентификации Шарат Панканти Пока слишком рано предсказывать, где, как и в каком виде в конечном итоге будут представлены надежные биометрические службы.