Очерк истории отечественных технологий баз данных

От редакции: Решив опубликовать отрывок из новой книги М.Р. Когаловского «Энциклопедия технологий баз данных», подготовленной к выходу в свет издательством «Финансы и статистика», мы неожиданно столкнулись, как выяснилось, с трудно выполнимой задачей. Выделить фрагмент, не нарушив строй энциклопедии, не рискуя исказить представление читателя об этом действительно фундаментальном труде, оказалось крайне сложно. В конце концов, мы остановились на разделе «Отечественные исследования и разработки» из главы «Краткий очерк эволюции технологий баз данных», который и публикуем — увы, с многочисленными сокращениями и купюрами. В частности, с сожалением пришлось опустить огромную библиографию и многочисленные ссылки на нее и на другие разделы энциклопедии. Оставленные для сохранения связности текста ссылки заменены фамилиями авторов. Надеемся, тем не менее, что эта публикация заинтригует читателя и послужит для него достаточным стимулом обратиться к оригиналу (см. также рецензию Сергея Кузнецова «Энциклопедия Когаловского» в разделе «Книжная полка ОС»), а также станет ярким свидетельством того, что платформа для сегодняшнего состояния технологий баз данных в нашей стране основательно готовилась собственными силами отечественных специалистов еще задолго до периода импорта технологий в 90-е годы.

Несмотря на то что потребности и предпосылки развития исследований и прикладных разработок, связанных с технологиями баз данных, существовали в нашей стране и ранее, активная деятельность в этой области развернулась лишь в начале 70-х гг. Именно в этот период в стране началось массовое производство вычислительных систем третьего поколения ЕС ЭВМ, обладающих дисковыми устройствами внешней памяти прямого доступа, без которой невозможно создание систем баз данных.

В деятельность, связанную с исследованиями технологий баз данных, с разработками и использованием основанных на них систем, с подготовкой кадров, вовлечен теперь широкий круг отечественных специалистов. Наша страна обладает сегодня значительным потенциалом в этих областях, сформированным за прошедшие тридцать лет. <...>

Организация и инфраструктура исследований и разработок

Сейчас уже трудно себе представить, что возможны такие условия, при которых происходило вхождение отечественных специалистов в зарождающийся мир баз данных. Из-за известных гонений, которым подверглась «лженаука» кибернетика, наша страна почти на десятилетие отстала от западного мира с производством вычислительной техники третьего поколения, на основе которой начались разработки технологий баз данных. При этом уже по внешнеполитическим причинам наша страна не имела возможности легальным образом приобретать такую технику и программное обеспечение систем баз данных, которое к 70-м гг. уже выпускалось за рубежом и распространялось на правах коммерческих программных продуктов.

Первым крупным в нашей стране форумом заинтересованных в рассматриваемой области специалистов стала состоявшаяся осенью 1973 г. в Ташкенте Всесоюзная конференция по автоматизированным системам управления, которая проводилась в Институте кибернетики Узбекской Академии наук. На конференции работала специализированная секция «Банки данных». Конференция привлекла внимание к проблематике баз данных в стране. К этому времени в нескольких организациях уже велись разработки инструментального программного обеспечения.

Конференция выявила острую необходимость создания постоянно действующего научно-общественного организационного ядра отечественного сообщества специалистов в области баз данных. Эта функция была возложена на учрежденную Государственным комитетом по науке и технике в 1974 г. Рабочую группу по программному обеспечению банков данных (РГБД), впоследствии (в 1984 г.) реорганизованную в Научно-техническую комиссию ГКНТ по банкам данных. Эта комиссия функционировала до 1987 г. Среди членов комиссии и весьма широкого круга специалистов, вовлеченных в сферу ее деятельности, комиссия неофициально всегда именовалась как и ее прародительница — РГБД. <…>

Позднее, в 1978 г. для развертывания и координации работ в рассматриваемой области в рамках Академии наук СССР была учреждена Комиссия по банкам данных и информационно-поисковым системам при Президиуме Академии наук, которая функционировала до 1991 г.

Совместными усилиями РГБД и Комиссии было организовано пять крупных научно-технических конференций национального масштаба по технологиям баз данных, осуществлялось формирование государственных планов научных исследований по профилю этих организаций, разрабатывались методические материалы, проводилась экспертиза разработок крупных систем программного обеспечения.

После распада СССР функции интеграции сообщества специалистов в области технологий баз данных стала осуществлять новая научно-общественная организация, учрежденная в 1992 г. Московская секция ACM SIGMOD, функционирующая до настоящего времени. <…>

В 90-е гг. в стране сформировался рынок программного обеспечения систем баз данных, образовались многочисленные коммерческие компании, оказывающие консалтинговые услуги, компании-интеграторы и поставщики технологий, коммерческие учебные центры. <…>

Создание программного инструментария

Одним из необходимых условий практического использования технологий баз данных является оснащение организаций-разработчиков и пользователей приложений необходимым программным инструментарием, прежде всего системами управления базами данных. Как уже отмечалось, на начальном этапе развития технологий баз данных, в стране не существовало таких программных средств и возможности их приобретения за рубежом. Поэтому необходимо было осуществить самостоятельные разработки СУБД, несмотря на отсутствие опыта создания таких сложных программных систем.

Первые шаги в решении этой задачи относятся к началу 70-х гг., когда началось производство вычислительных машин семейства ЕС ЭВМ. Работы проводились в двух направлениях. Прежде всего были предприняты попытки создания собственных оригинальных отечественных СУБД. Вместе с тем, в ускоренном режиме разрабатывались аналоги некоторых широко распространенных за рубежом СУБД, способных функционировать на отечественных аппаратно-программных платформах. Подобный подход был использован также при создании СУБД для аппаратных платформ, серийное производство которых началось в стране позднее появления платформы ЕС ЭВМ, — для СМ ЭВМ, АСВТ, IBM-совместимых персональных компьютеров и др.

Вероятно, первым проектом в нашей стране, направленным на создание оригинальной отечественной СУБД, соответствующей передовым достижениям международного уровня, была СУБД типа CODASYL НАБОБ для платформы ЕС ЭВМ, разработка которой началась в указанный период в ВГПТИ ЦСУ СССР.

Наряду с СУБД НАБОБ впоследствии были разработаны также и другие оригинальные отечественные системы. СУБД типа CODASYL ПАРМА для платформы ЕС ЭВМ с операционной системой ОС ЕС была создана НИИУМС (г. Пермь). В Вычислительном центре Академии наук была разработана СУБД типа CODASYL КОМПАС для платформы БЭСМ-6 с операционной системой ДИСПАК.

В Институте проблем управления были начаты работы по реализации СУБД иерархического типа для платформы ЕС ЭВМ, которые были продолжены ВНИИСИ и завершились созданием системы ИНЕС. Эта система имела большое число пользовательских установок. В Институте кибернетики АН УССР было создано семейство совместимых реляционных СУБД ПАЛЬМА для платформ ЕС ЭВМ, СМ ЭВМ и IBM-совместимых персональных компьютеров. В Министерстве легкой промышленности Латвии была разработана развитая реляционная СУБД ВЕРА. Институт системного программирования РАН создал мобильный SQL-сервер на платформе UNIX и в качестве средства свободно распространяемого программного обеспечения передал его вместе с исходными текстами в консорциум Free Software Foundation. Институтом системного анализа РАН разработана мультимедийная СУБД НИКА для персональных компьютеров. Следует упомянуть также, созданное в Воронежском СКТБ «Системпрограмм», семейство совместимых реляционных СУБД ИНТЕРЕАЛ для различных программно-аппаратных платформ и, созданный в последние годы, вполне конкурентоспособный реляционный сервер баз данных ЛИНТЕР компании РЕЛЭКС (Воронеж). Среди отечественных систем, созданных в последние годы, имеются и объектные СУБД, например, система ODB-Jupiter компании ИНТЕЛТЕК ПЛЮС. <…>

Нужно заметить, что процесс создания большинства названных отечественных систем включал существенные элементы исследовательской работы. Это связано не только с новизной проблемы, отсутствием опыта реализации таких систем и доступной литературы, особенно на ранней стадии таких разработок в стране, но и с тем, что СУБД — это довольно сложная программная система, при создании которой возникает довольно много трудных проблем и возможно множество альтернативных решений. Кроме того, обратим внимание на то обстоятельство, что большинство оригинальных отечественных СУБД создавалось в научно-исследовательских организациях, что, без сомнения, привносило творческий исследовательский аспект в разработки.

Среди СУБД и других средств программного обеспечения систем баз данных, созданных в нашей стране и имеющих зарубежные аналоги, наиболее широкое распространение получили: СУБД СИНБАД (МНИПИ АСУ ГХ); СУБД ОКА и телемонитор КАМА Института кибернетики АН УССР; СУБД ДИСОД, разработанная НИИ «Восход»; система БАНК Пермского НИИУМС; созданная Советско-болгарским институтом ИНТЕРПРОГРАММА в Софии система СЕДАН; система РЕБУС Всесоюзного научно-исследовательского института непромышленной сферы и ряд других разработок. Нужно заметить, что некоторые из перечисленных систем, например, ОКА и ДИСОД, имели чрезвычайно развитое окружение, функционально значительно более богатое, чем у систем-прототипов.

В 90-е гг. в нашей стране сформировался развитый рынок программного обеспечения систем баз данных, на котором наряду с крупнейшими в мире поставщиками программных продуктов данной категории представлены и компании-разработчики второго эшелона. Отечественные пользователи, располагающие финансовыми средствами, могут приобрести сегодня лицензии на право пользования адекватными их потребностям реляционными, объектно-реляционными и объектными СУБД для различных аппаратно-программных платформ.

Зарубежные системы имеют в нашей стране в настоящее время подавляющее число установок. Большинство же отечественных разработок уже не эксплуатируется, поскольку прекращен выпуск аппаратных платформ, на которые они были ориентированы. Вместе с тем некоторые системы (ЛИНТЕР, НИКА и др.) успешно выдерживают конкуренцию с западными программными продуктами, хотя и не имеют такого же широкого распространения. Причины их ограниченного использования заключаются вовсе не в том, что отечественные продукты уступают конкурентам в функциональном отношении, а в необходимости крупных капиталовложений для обеспечения полноценного маркетинга, сопровождения и развития продуктов, предоставления сервисных услуг пользователям.

Разработка приложений

Главной сферой применения технологий баз данных в нашей стране в период 70-х — 80-х гг. являлись автоматизированные системы управления различного уровня в экономике. Разрабатывались такие крупнейшие уникальные системы макроуровня, как Автоматизированная система плановых расчетов (АСПР) Госплана страны и плановых органов республик и Автоматизированная система Государственной статистики (АСГС). Несколько позднее СУБД стали неотъемлемым компонентом программного обеспечения многочисленных отраслевых систем управления.

Однако наиболее массовой сферой применения были автоматизированные системы управления предприятиями. Типовую архитектуру таких систем и комплекс типовых приложений разработал институт «Центрпрограммсистем» (г. Калинин). Этот инструментарий использовался на практике многочисленными промышленными предприятиями страны.

Активную поддержку деятельности в указанном направлении оказывал международный Советско-болгарский институт «Интерпрограмма» (София), которым было создано разнообразное типовое программное обеспечение, получившее широкое распространение в обеих странах. <…>

В 80-е гг. на основе технологий баз данных был создан ряд информационных систем центральных организаций различных ведомств — патентной службы, Госстандарта, Высшей аттестационной комиссии, Всесоюзного научно-технического информационного центра и др. СУБД начали использоваться для создания информационных систем на транспорте и в строительстве, в крупнейших государственных библиотеках, в системах управления сложными техническими системами и во многих других областях. Однако все эти разработки были доступны лишь крупным организациям, способным содержать в своей структуре центры обработки данных.

Радикальное изменение ситуации произошло во второй половине 80-х гг., когда в стране стали появляться персональные компьютеры. Даже весьма скромные по своим функциональным возможностям и чрезвычайно простые в использовании СУБД, созданные для этой быстро прогрессирующей аппаратной платформы, дали возможность применять простейшие технологии баз данных в системах обработки данных для удовлетворения информационных потребностей практически в любой области жизнедеятельности. <…>

Научные исследования в области систем баз данных

<…>

Исследования, связанные с разработками новых СУБД. <…> Фактор абсолютной новизны проблемы для отечественных специалистов требовал проведения исследований на многих этапах реализации первой отечественной СУБД типа CODASYL — НАБОБ. При создании системы ИНЭС, ставшей прототипом СУБД ИНЕС, исследовались методы доступа. Был переоткрыт метод хеширования, разработана организация индекса в виде древовидной структуры с расщепляющимися блоками. В ИНЕС впервые среди иерархических СУБД применена идея самоописываемости баз данных, предложенная ранее для реляционных систем. На основе опыта реализации системы КОМПАС ее авторами была предложена интегрированная реляционно-сетевая модель данных.

При создании SQL-сервера Института системного программирования был основательно изучен, обобщен и эффективно использован опыт реализации пионерских исследовательских прототипов реляционных СУБД — System R и Ingres, воплощены концепции открытых систем и мобильности программного обеспечения, использованы некоторые принципы объектного подхода.

Создатели системы ПАЛЬМА использовали в своем проекте принципы многоуровневой архитектуры СУБД и технику отображения моделей данных.

Развитие теории реляционных баз данных. Проблемы математической теории реляционных баз данных вызвали в нашей стране столь же значительный интерес, как и за рубежом. Им были посвящены многочисленные исследования, выполненные в основном в 70-е — 80-е гг.

Наибольшее число работ этого направления было связано с исследованиями в области теории зависимостей и теории нормализации, с оценкой возможностей реляционных языков, с вопросами эквивалентности реляционных баз данных, с алгебраическими аспектами реляционной модели данных. Исследовались также аксиоматические подходы в области реляционной модели, формальные методы синтеза схем и логического проектирования реляционных баз данных, взаимосвязь логики и реляционной модели, вопросы вычислимости реляционных запросов. Большое внимание привлекали проблемы неполноты информации в реляционных базах данных. <…>

Моделирование данных. Проблемы, связанные с моделированием данных и разработками конкретных моделей разнообразного назначения, — это тема на все времена. Отечественные работы в этой области начались еще в 70-е гг.

К этому направлению относятся, в частности, исследования, связанные с созданием канонической модели данных для систем интеграции неоднородных баз данных [Л.А. Калиниченко и др.] и моделей данных концептуального уровня архитектуры мультимодельной многоуровневой СУБД [М.Р. Когаловский и др.]. <…> Некоторыми авторами вводятся различного рода расширения реляционной модели. <…>

В середине 70-х гг. в языках программирования сформировалась концепция абстрактного типа данных, которая оказала влияние на дальнейшее развитие подходов в области моделирования данных. <…>

Более общий подход к конструированию моделей данных как системы типов был предложен в [А.В. Замулин]. Практическая реализация этого подхода осуществлена его автором на основе языка программирования баз данных Атлант.

Другим конкретным примером его реализации может служить работа [Х.-М. Хаав], где «универсальная» модель данных позволяет выражать функциональные возможности реляционной, сетевой и иерархической моделей. Эта модель определяется средствами языка Утопист системы программирования ПРИЗ [М.И. Кахро и др.].

Более мощные модели потребовались в системах интеграции неоднородных информационных ресурсов, разработки которых начались в 90-е гг. Одна из моделей такого рода определяется языком Синтез [Л.А. Калиниченко]. Использование интегрирующей модели, основанной на спецификациях RDF, предусматривается в [А.Н. Бездушный и др.]. <…>

Отображение моделей данных. В связи с разработками распределенных систем баз данных, систем интеграции неоднородных баз данных и СУБД с многоуровневой архитектурой, в том числе мультимодельных систем, возникли проблемы отображения моделей данных. Их решению были посвящены исследования отечественных авторов, направленные на создание методов преобразования моделей данных и конструирования коммутативных отображений, разработку архитектурных аспектов отображения моделей данных и спецификаций определения отображений для конкретных моделей данных. <…>

Исследования проблем отображения моделей данных проводятся также в последние годы в различных проектах, связанных с интеграцией неоднородных информационных ресурсов, в частности в проектах электронных библиотек. Конкретные темы исследований — отображение современных моделей данных в каноническую интегрирующую модель, создание адаптеров для информационных ресурсов различной природы в системах интеграции, представление слабоструктурированных данных в среде реляционных баз данных и др.

СУБД с мультимодельным внешним уровнем. В отечественных исследовательских проектах, связанных с разработками мультимодельных СУБД, использовалось два подхода. [В первом из них] <…> [М.Р. Когаловский и др.] <…> роль концептуальной модели данных играет функционально достаточно развитая модель, обеспечивающая возможности отображения широко распространенных моделей. В [одном случае] в качестве концептуальной модели используется модель позиционных множеств, а во втором — модель плексов.

Второй подход ориентировался на новые достижения в языках программирования. При этом концептуальная модель, строго говоря, не фиксируется в системе. В системе программирования баз данных АТЛАНТ <…> предусматривается возможность ее спецификации как некоторой системы типов данных, определяемых средствами инструментальной системы пользователем (выступающим, таким образом, в роли создателя конкретной СУБД) в терминах ее базового языка программирования Атлант.

Аналогичный подход фактически применяется в [Х.-М. Хаав], где инструментальной системой служит система программирования ПРИЗ. В этом случае концептуальная модель данных определяется в виде исходной спецификации на языке Утопист и транслируется далее в некоторую систему аксиом, управляющую функционированием инструментальной системы. <…>

Разработка, выбор и оценка методов доступа. Значительное внимание в отечественных исследованиях уделялось методам доступа — важным функциональным компонентам СУБД.

Для экономической информационной системы ИНЭС, послужившей прототипом иерархической СУБД общего назначения ИНЕС, независимо от широко известных теперь зарубежных работ были созданы метод хеширования и эффективная техника индексирования на основе растущего дерева.

Исследовалась техника индексирования временных и пространственных данных, основанная на использовании TSB-деревьев и различных модификаций R-деревьев [Б.А. Новиков и др.], а также индексирования объектных данных [А.Н. Годунов]. <…>

Была разработана и экспериментально исследована система хранения сложных объектов различных видов [Б.А. Новиков]. <…>

Самоописываемые базы данных. Принципы самоописываемости баз данных, позволяющие применять единые методы доступа для данных и метаданных, были впервые использованы еще в проекте ранней реляционной СУБД MACAIMS, а впоследствии были воплощены в виде информационной схемы в стандарте SQL-92. Подход к представлению схемы базы данных в среде СУБД средствами иерархической модели данных <…> реализован в отечественных СУБД ИНЕС и НИКА.

Управление конкурентным доступом. Среди ранних отечественных публикаций в области управления конкурентным доступом в системах баз данных можно назвать прежде всего работу [Оленин М.В. и др.], в которой предложена и исследована модель параллельных транзакций для распределенной объектной среды. <…> Заслуживает также упоминания осуществленная в рамках проекта свободно распространяемого мобильного SQL-сервера реализация метода сериализации транзакций, основанного на двухфазном протоколе предикатных блокировок [С.Д. Кузнецов и др.].

Исследовалась техника поддержки вложенных транзакций и транзакций других типов на уровне механизмов управления буферизацией в среде хранения базы данных [Г.Г. Домбровская]. Этим же вопросам посвящена работа [того же автора], в которой показано, что включение некоторой дополнительной информации в дерево активных транзакций позволяет существенно расширить область применения рассматриваемой техники управления транзакциями. <…>

Системы программирования баз данных и знаний. Идеи создания языков программирования, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными, были впервые высказаны А.В. Замулиным. <…> Система программирования с входным языком Бояз [созданного им в стиле весьма популярного в тот период языка Pascal] была реализована на платформе БЭСМ-6 и использовалась в некоторых организациях.

Языки такого рода стали называться языками программирования баз данных (а впоследствии — и баз знаний). Разработки их активно осуществлялись в ряде научных центров Европы, США и Канады.

Группой А.В. Замулина был выполнен большой комплекс исследований в области языков программирования баз данных, разработан и реализован более современный (по сравнению с Бояз) язык Атлант. <…>

Аналогичный весьма интересный подход в области создания единой среды языка программирования и базы данных был предложен позднее, в конце 70-х гг. в Институте кибернетики АН ЭССР (Таллин). Средствами системы программирования высокого уровня ПРИЗ, которую ее идеолог Э.Х. Тыугу квалифицирует как инструмент концептуального программирования, можно не только программировать приложения, но и описывать, а также поддерживать на стадии исполнения нужную модель данных для этого приложения. Таким образом авторами была реализована, например, СУБД DABU.

Машины баз данных. Проблемы создания машин баз данных, вызвавшие большой интерес во всем мире после появления реляционной модели данных, а особенно после бума машин пятого поколения, спровоцированного известным японским проектом, привлекли большое внимание и в нашей стране.

Первые отечественные исследования в этой области относятся к концу 70-х — началу 80-х гг. <…>

Новый всплеск разработок в этой области был связан с учреждением в стране в середине 80-х гг. программы НИР по созданию средств вычислительной техники нового поколения и с организацией работ в этом направлении на основе международной кооперации. В рамках этой программы в ряде исследовательских коллективов проектировались программно-аппаратные средства, создавались реализованные программным путем макеты машин баз данных. <…>

Объектные базы данных. Развитие объектного направления в технологиях баз данных, появление первых СУБД, основанных на объектной парадигме, публикация Манифеста объектно-ориентированных систем баз данных — все это, естественно, привлекло внимание к объектным базам данных и в нашей стране.

В ранней работе [С.Д. Кузнецов] анализируются важнейшие принципы объектного подхода и концепции объектных СУБД. При этом уделяется особое внимание аспектам моделирования данных, языкам запросов в таких системах и оптимизации объектных запросов. <…>

Принципы отображения развитых объектных моделей исследовались в рамках проекта СИНТЕЗ Института проблем информатики РАН на примере модели данных, определяемой одноименным языком этого проекта, и объектной модели ODMG, были также разработаны спецификации соответствующих отображений.

Опубликованный в 1993 г. первый стандарт объектных баз данных ODMG-93 подвергся критике со стороны ряда исследователей <…>[Л.А. Калиниченко и др.]. <…>

Дедуктивные базы данных. Как известно, этот класс систем баз данных является продуктом применения аппарата математической логики и средств логического программирования в области систем баз данных.

К числу ранних исследований, выполненных в нашей стране в этом направлении, можно отнести разработки Института прикладной математики Академии наук, в результате которых была создана действующая система «Вопрос-ответ». [Э.З. Любимский и др.]Факты представляются в базе данных этой системы на основе парадигмы «объект-свойство-значение», а дедуктивные возможности определяются с помощью совокупности правил вывода.

Большой цикл теоретических исследований в области дедуктивных баз данных выполнен совместно М.И. Дехтярем (Тверской государственный университет) и А.Я. Диковским (РГГУ). <…>

Наряду с чисто дедуктивными системами для отечественных исследователей представляли интерес смешанные объектно-дедуктивные системы баз данных. <…>

Основательный анализ и классификация известных методов вычисления и оптимизации рекурсивных запросов в системах дедуктивных баз данных содержатся в [В.И. Задорожный]. <…> [Ему] принадлежат также другие результаты в области языков запросов и оптимизации в дедуктивных базах данных. <…>

Пространственно-временные базы данных. Отечественные исследования в области пространственно-временных баз данных были связаны, по существу, лишь с аспектами эффективных методов доступа к данным этой природы. <…>

Распределенные базы данных. В 70-е гг. в нашей стране активизировались работы по созданию вычислительных сетей. При этом в стиле, вполне адекватном централизованному характеру управления экономикой и другими сферами жизнедеятельности советского государства, была поставлена масштабная задача создания Государственной сети вычислительных центров (ГСВЦ). В проекте такой сети предусматривалось и создание функционирующих в ее среде распределенных баз данных (по терминологии того времени — «банков данных»).

Основные исследования в этом направлении развернулись в научных учреждениях Москвы (ИНЭУМ, ИПМ, ВГПТИ ЦСУ СССР), Киева (ИК АН УССР), Риги (ИЭВТ АН Латвийской ССР) и др. <…>

Одно из направлений исследований было посвящено разработке математических моделей, позволяющих оптимизировать организацию и функционирование систем распределенных баз данных <…> [Е.М. Бениаминов и др.].

Важная проблема — организация неоднородных распределенных баз данных с возможностями интеграции данных — рассматривалась <…> в соответствии с концепциями исследовательского проекта СИЗИФ, который выполнялся в этот период в ИНЭУМ.

Уже на раннем этапе исследований разрабатывались конкретные инструментальные средства для создания распределенных баз данных. В качестве примера можно сослаться на гибридную СУБД БАЗИС (ИНЭУМ), поддерживающую интегрированные базы данных с фактографическими и текстовыми данными. <…>

Интеграция информационных ресурсов. Исследования в области интеграции информационных ресурсов начались в нашей стране в середине 70-х гг. в рамках работ по созданию распределенных баз данных.

Наиболее ярким представителем отечественных разработок этого периода, без сомнения, является пионерский проект СИЗИФ Института электронных управляющих машин. В проекте была разработана архитектурная концепция системы интеграции неоднородных баз данных, основанная на некоторой интегрирующей канонической модели, обеспечивающей единое представление данных для всех включаемых в систему баз данных. Это единое представление - схема виртуальной базы данных — описывается с помощью специального языка. Был предложен также основанный на логике предикатов язык манипулирования данными, представленными в терминах этой схемы.

Авторами проекта был разработан, кроме того, метод построения коммутативных отображений моделей данных, обеспечивающий поддержку соответствия между данными интегрируемых баз данных и данными виртуальной базы данных. Применение этого метода было продемонстрировано на примере отображения сетевой модели данных CODASYL в реляционную модель. <…>

На основе полученных результатов в Институте проблем информатики РАН в начале 90-х гг. был инициирован проект СИНТЕЗ. Его целью являлось создание методологии и инструментария для разработки неоднородных интероперабельных сред информационных ресурсов. При этом имелась в виду семантическая интероперабельность. Основой проекта служит одноименный мощный объектный язык высокого уровня с развитой современной системой встроенных типов и с механизмами конструирования типов, определяемых пользователем, с фреймовыми и логическими возможностями, со средствами описания активного поведения (деятельностей).

В ряде публикаций по материалам проекта были показаны возможности использования языка Синтез для однородного описания информационных ресурсов, представленных средствами разнообразных моделей структурированных и слабоструктурированных данных. <…>

Дальнейшие шаги авторов рассматриваемого проекта направлены на обеспечение семантической интеграции информационных ресурсов на основе использования механизмов посредников и онтологических спецификаций. Для этих целей разработана общая архитектура системы интеграции ресурсов, позволяющая решать указанную задачу. В качестве примера использования предложенного подхода в Институте цитологии и генетики СО РАН разрабатывается предметный посредник для интеграции информационных ресурсов в области молекулярно-генетических исследований. <…>

К сожалению, нужно отметить, что технологии семантической интеграции информационных ресурсов не стали пока достоянием промышленных технологий. Вместе с тем, в последние годы в нашей стране на практике успешно реализуются довольно крупные проекты интеграции ресурсов на более низком семантическом уровне. Примером такого проекта может служить разрабатываемая Вычислительным центром РАН совместно с рядом других организаций система ИСИР РАН (Интегрированная система информационных ресурсов РАН). <…>

Проектирование баз данных и разработка приложений. Едва ли не самая популярная сфера исследований и разработок в области технологий баз данных в нашей стране связана с проблемами проектирования систем баз данных, решение которых имеет весьма важное значение для обеспечения эффективного практического использования этих технологий.

Пик активности отечественных исследований в этой области пришелся на 80-е гг. Не случайно на Второй Всесоюзной конференции «Банки данных» для обсуждения проблем проектирования баз данных была организована специальная секция. В этот период в различных научных центрах страны над указанной проблематикой успешно работало несколько групп исследователей. Конечно же, весьма привлекательным было направление, связанное с формальными методами синтеза схем реляционных баз данных. Однако разрабатывались и иные подходы, главной целью которых являлось создание средств инфологического моделирования предметной области системы базы данных и отображения его результатов в среду конкретных СУБД.

Одно из направлений этих работ было связано с созданием «инженерной» методики проектирования концептуальной схемы базы данных в терминах, близких к ER-модели, и преобразования ее в схему базы данных избранной проектировщиком СУБД [В.В. Бойко и др.]. <…>

Более формализованный подход с использованием специально разработанных развитых средств инфологического моделирования был предложен группой исследователей из ВНИПИ АСУ Газпрома и ВНИИПОУ ГКНТ. По замыслу авторов это исследование должно было стать теоретическим базисом автоматизированной системы проектирования баз данных. Был разработан прототип такой системы — Омега-1.

Другой, также нацеленный на автоматизированную технологию проектирования подход, был предложен в ИК УССР. Разработанная автором модель для описания предметной области системы поддерживает иерархию абстракций различного рода. На ее основе создан язык описания концептуальных схем. Реализован прототип системы ПРОБАД, базирующийся на предложенном подходе.

В работах [Г.И. Фурсин и др.] <…> главные цели заключались в создании концептуальной модели данных высокого уровня, основанной на исчислении предикатов, технологии ее использования, а также инструментария для поддержки процесса моделирования предметной области системы базы данных ее средствами.

Представляет интерес подход <…> [В.М. Ветошкин и др.], <…> [в котором] источником информации для формализованного процесса синтеза схемы реляционной базы данных служит вербальное описание предметной области. Разработан также метод синтеза схемы базы данных, оптимальной относительно введенного автором критерия сложности.

Наряду с указанными подходами развивалось направление, связанное с моделированием семантики предметной области средствами, используемыми в системах представления знаний [М.Ш. Цаленко], [Э.Х. Тыугу], [М.И. Кахро и др.]. <…>

Между тем продолжающиеся в разных странах почти четверть века исследования и практические эксперименты в области структурных и объектных методов анализа и проектирования привели к формированию индустрии, выпускающей довольно широкий спектр коммерческих продуктов CASE, основанных на этих методах. Многочисленные поставщики предлагают разнообразные средства быстрой разработки приложений, основанные, главным образом, на технике визуального проектирования.

Встроенными средствами разработки несложных локальных приложений, обеспечивающих, в частности, генерацию программного кода, оснащено большинство СУБД для персональных компьютеров.

В 80-х — начале 90-х гг. исследования в области CASE для разработки информационных систем активно проводились в нашей стране. Как правило, выполнявшиеся проекты завершались созданием исследовательского прототипа или производственной CASE-системы. Тем не менее, даже достаточно развитые отечественные CASE-средства не получили заметного распространения в высоко конкурентной среде, образовавшейся в связи с тем, что рынок программных продуктов CASE, поставлямых рядом зарубежных компаний, охватил и нашу страну. <…> Однако остается большое поле деятельности для дальнейших исследований в рассматриваемой области. Их актуальные направления — создание компонентных технологий проектирования, обеспечивающих интероперабельность и повторное использование компонентов, интеграция неоднородных информационных ресурсов, в том числе и на семантическом уровне, персонализация пользовательских интерфейсов, создание композиционных методов разработки информационных систем, проблемы реинжиниринга существующих систем и др.

Значительные результаты в рассматриваемых направлениях получены в последние годы в Институте проблем информатики РАН, где группой СИНТЕЗ проводятся комплексные исследования композиционных методов, разработан ряд прототипов средств CASE. <…>

Выбор и оценка СУБД. Проблемы выбора СУБД для конкретных приложений или для приложений в некоторой специфической предметной области, а также для оценки характеристик их функционирования злободневны на всех стадиях развития технологий, когда речь идет о разработках крупных систем и систем с критическими требованиями к производительности, ресурсам памяти, надежности.

В отечественных разработках систем баз данных делались попытки определения совокупности факторов, которые могут стать основой выбора и оценки СУБД для конкретного приложения. Проводился сравнительный анализ характеристик различных СУБД, предлагались методики оценки и выбора СУБД для конкретных приложений.

Предпринимались также попытки оценки характеристик функционирования СУБД с помощью методов имитационного моделирования [Г.К. Столяров и др.], [О.М. Вейнеров]. <…> Применение техники имитационного моделирования не получило, однако, дальнейшего развития. Вероятно, одна из причин состоит в том, что получаемые с помощью дорогостоящих имитационных моделей оценки оказываются весьма грубыми. Более эффективными оказались подходы, основанные на использовании средств сбора статистики функционирования, которыми оснащены современные СУБД. Для оценки производительности СУБД в среде некоторых типовых приложений консорциумом TPC разработаны эталонные тесты. В период, когда этот консорциум еще не был учрежден, близкий подход использовался в исследованиях Центрпрограммсистем, связанных с получением сравнительных оценок производительности промышленно-сопровождаемых СУБД.

В последнее время в разработках крупных отечественных информационных систем для выбора одного из альтернативных вариантов инструментальных средств часто используют приближенные количественные оценки их производительности в данном конкретном приложении. С этой целью создается прототип приложения, и на его основе проводятся необходимые измерения для разных инструментальных СУБД. Одним из примеров использования такого подхода, результаты которого вызвали оживленную дискуссию, может служить проект системы ЭКСПРЕСС для железнодорожного транспорта. <…>

Общая оценка состояния

Сегодня наша страна обладает достаточно высоким потенциалом в области разработки и эксплуатации систем баз данных различного масштаба во многих областях применения.

Сложилось значительное количество коллективов, способных квалифицированно разрабатывать не только приложения, но и инструментальные программные средства коммерческого уровня для систем баз данных — всевозможные адаптеры, конверторы, шлюзы и т.д., вплоть до полнофункциональных реляционных или объектных СУБД.

Немаловажную роль в формировании этого потенциала, без сомнения, сыграли те исследования и разработки в рассматриваемой области, которые проводились у нас начиная с 70-х гг.

К сожалению, в настоящее время исследовательская часть отечественного сообщества специалистов в области систем баз данных выглядит несравненно скромнее, чем прикладная. Удельный вес научных работников в общем числе специалистов, занятых в рассматриваемой области, в 90-е гг. существенно снизился. Масштабы проводимых исследований значительно уступают их состоянию в период 70-х — 80-х гг.

Однако, несмотря на все трудности, которые испытывает отечественная наука, в нашей стране все-таки существуют отдельные исследовательские группы. Ряд исследовательских проектов вполне адекватен достигнутому мировому уровню. Функционирует целый ряд учебных центров, готовящих кадры для реализации крупных проектов корпоративных информационных систем. Поэтому есть основания с оптимизмом смотреть в будущее.

М.Р. Когаловский, Энциклопедия технологий баз данных. М.: «Финансы и статистика», 2002, 800 c.