Информатизация российского общества предполагает обеспечение удаленного доступа всем заинтересованным лицам к различным документам, в том числе хранящимся в государственных архивах и библиотеках, вне зависимости от их местонахождения. Однако автоматизация

Решение о создании электронного архива документов, хранящихся в Центральном государственном историческом архиве Республики Башкортостан (ЦГИА РБ) было принято совместно с Управлением по делам архивов при Правительстве Республики Башкортостан еще в 1995 году. Перевода в электронный формат требовали в первую очередь архивные документы, находящиеся в ветхом физическом состоянии, а главное — в единственном экземпляре на всю Россию. Речь идет о метрических книгах и ревизских сказках, возраст некоторых из них насчитывает 100–200 лет, а то и более.

Ревизские сказки — это результаты переписи населения Оренбургской и Уфимской губерний, относившегося к податным сословиям (крестьяне, посадские люди, работные и вольные люди и др.), начиная с конца XVIII века. Помимо ревизских сказок в фонде Оренбургской казенной палаты находятся городовые обывательские книги, введенные согласно городовому положению 1795 года. Метрические книги, хранящиеся в архиве, содержат данные о мусульманском населении значительной части России. Они собраны здесь, в единственном месте, так как именно в Уфе находилось и находится Центральное Духовное управление мусульман России и европейских стран СНГ, образованное еще в 1789 году указом императрицы Екатерины II как Оренбургское магометанское духовное собрание.

В фондах сегодня хранятся архивы губернских и уездных учреждений, ревкомов, республиканских и местных органов власти советского периода, промышленных предприятий и объединений, учреждений сельского хозяйства, профсоюзных организаций. В архиве также находятся личные фонды деятелей науки и культуры, имеется различная научно-техническая документация.

В ЦГИА РБ находятся документы, без которых невозможно составить родословную, иметь которую сегодня считается очень престижным. Создание системы доступа к этой информации позволило бы не только облегчить труд сотрудникам архива, которым приходилось работать с книгами весом десять и более килограммов, но и повысить сохранность уникальных исторических документов.

Важность этих документов и необходимость их оцифровки невозможно переоценить. Но реализация проекта была отложена, так как все государственные учреждения имеют ограниченный бюджет, а сканирующее оборудование и хранилища данных на тот период стоили десятки миллионов рублей. С развитием технологий сканирования и хранения данных к 2007 году стоимость реализации подобных проектов снизилась в несколько раз. К этому времени появились примеры внедрения этих технологий в архивной отрасли, на рынке предлагались как отдельные программные продукты, так и решения под ключ, предполагавшие выезд к заказчику лаборатории, которая делает «залповый» ввод документов, создает поисковые базы данных и в качестве конечного результата выдает электронный архив документов. Но стоимость такого проекта для ЦГИА РБ была неподъемна.

Сегодня

«Решение выполнять работы самостоятельно было продиктовано не только ограниченностью финансов, — рассказывает Юрий Перескоков, главный инженер-электроник управления по делам архивов при правительстве РБ, руководитель Центра автоматизированных архивных технологий. — Выгода в том, что в настоящий момент архивисты республики уже накопили богатый опыт, и все сканирующее оборудование осталось здесь, в Уфе, тогда как в случае реализации проекта под ключ после завершения всех работ исполнитель, как правило, вывозит оборудование. В дальнейшем на базе ЦГИА РБ мы планируем оказывать услуги министерствам, ведомствам и другим учреждениям в создании ЭАД. Архивы, бумажные и электронные, сегодня есть в каждой организации, но закупать оборудование и создавать подобные системы самостоятельно каждому учреждению не только не по силам, но и нецелесообразно».

После выделения средств в размере 3,148 млн руб. был проведен аукцион по пяти лотам, и уже к концу 2008 года ЦГИА РБ получил два планшетных сканера, серверы и рабочие станции, лицензионное системное и прикладное программное обеспечение. Был создан аппаратно-программный комплекс, в котором каждая страница уникальных архивных документов проходит четыре этапа обработки: перевод в электронный формат, графическое редактирование, «привязку» к автоматизированной информационно-поисковой системе. Последнюю стадию — сопоставление архивной информации о населенных пунктах с современным административным делением республики (районами Башкирии) — выполняют историки-архивисты с использованием многочисленных исторических источников и справочников.

Специализированное оборудование было закуплено у компании «ЭЛАР», поставляющей решения под ключ. В качестве базового программного решения для организации доступа был выбран корпоративный документальный сервер eDocLib, разработанный компанией «Электронные офисные системы» (ЭОС). Это специализированное программное обеспечение поставляла уфимская компания «Медиалюкс», региональный партнер ЭОС. Система eDocLib обеспечивает хранение, систематизацию и коллективный доступ к электронным документам и данным практически произвольной структуры, включая как единичные, так и табличные данные и графику.

Решение о самостоятельном наполнении базы данных переложило всю нагрузку на рабочую группу архива, которая организовала и реализовала сканирование, графическое редактирование и размещение в базе данных (в соответствии с современной картой Башкортостана) информации о населенных пунктах, содержащейся в уникальных исторических документах. Сканирование в 2009 году выполняли девять сотрудников, графическое редактирование в 2009–2010 годах — более 20. В рамках проекта была создана специальная система классификации документов. В качестве реквизитов, применяемых для классификации документов, использовали следующие параметры: населенный пункт, год, губерния, волость, уезд, опись, социальный слой, современный район, номер документа и т. д.

В результате реализации проекта параллельно был создан и фонд пользования графических образов — отсканированных изображений каждой страницы из 807 дел. В читальном зале появилась возможность одновременно работать с одним документом у большого числа желающих. Теперь можно осуществлять поиск по населенным пунктам.

«Пока нет возможности искать по фамилиям и именам, которые упоминаются в документах. Сделать это автоматически пока нереально и невозможно: информация в ревизских сказках встречается на двух-трех языках, а распознавать старославянскую письменность еще не научились, — рассказывает Перескоков. — Мы хотели осуществить такую возможность, но оказалось, что сделать это нельзя».

На создание ЭАД «Ревизские сказки» затрачено более полутора лет, сегодня проект практически завершен: выполнено сканирование, практически закончено графическое редактирование, более чем на 80% осуществлена привязка к базе данных. Количество документов и других файлов, доступных для просмотра с помощью eDocLib 2.4, в настоящее время приближается к полумиллиону. С июня 2010 года открыт общий доступ к архиву «извне». Сокращению сроков реализации проекта способствовало наличие тематической базы данных «Ревизские сказки» объемом более 42 тыс. записей, созданной специалистами ЦГИА РБ в 1994–1999 годы для исполнения тематических запросов. Создание структуры базы данных и первичная загрузка нескольких сотен тысяч записей в базу данных заняла у компании «Медиалюкс» всего несколько дней.

Завтра

В ЦГИА РБ более 15 лет создаются и используются учетные и тематические базы данных. Учетные базы содержат информацию об архивных фондах. Для автоматизации работы с ними используется федеральный программный комплекс «Архивный фонд» версий 3 и 4. Как сообщает Перескоков, сегодня все государственные и муниципальные архивы республики (всего их 65) заняты решением этой задачи, поставленной Федеральной архивной службой России и нацеленной на создание единой федеральной учетной базы данных, содержащей информацию о фондах, описях, делах и единицах хранения. Тематических баз данных в республиканских архивах более тридцати. Это базы узкой направленности — например, содержащие информацию о награжденных медалью «За доблестный труд в Великой Отечественной войне» и т. п.

Создавать такие базы начали еще в 90-е годы, создаются такие базы и сегодня. Сначала они обычно используются только для внутреннего пользования, а затем на их основании издаются книги, информация поступает в открытый доступ. Например, издание «Герои тыла» в 20 томах, сформированное на основе указанной выше тематической базы данных, содержит информацию о более чем 450 тыс. награжденных. Есть база данных личных дел секретарей КПСС, сформированная на основе партийных архивов, а также личных дел других номенклатурных работников. В годы Второй мировой войны в Уфу и другие города республики были эвакуированы государственные архивы из западных и центральных регионов Советского Союза.

Оцифровка ревизских сказок — это лишь малая часть того, что предстоит сделать. Проект перевода метрических книг в электронный формат будет сложнее не только из-за объема, в десять раз превышающего объем ревизских сказок, но и потому, что записи в них велись на нескольких языках, в том числе на основе арабской графики. Этот проект займет гораздо больше времени. Сейчас большим спросом пользуются документы, связанные с правами собственности, в том числе предыдущих поколений, — в Башкирии сегодня идет огромное строительство. «Но нужно четко понимать, что даже если чьи-то родственники были владельцами какого-то здания на центральной улице Уфы, то ценнейший документ, подтверждающий права собственности, может быть востребован ограниченное количество раз, — поясняет он. — А такие массивы, как ревизские сказки и метрические книги, будут в ближайшие годы особенно востребованы. Это огромный массив информации, требующий соответствующей ИТ-инфраструктуры, и поэтому необходимо достаточное количество мощных серверов, информационных хранилищ электронных архивов. Но пока их нет. В настоящее время идет согласование проекта второй очереди электронного архива документов.