Модель "сущность-связь" - шаг к единому представлению о данных | Системы управления базами данных

Петер Пин-Шен Чен

1. ВВЕДЕНИЕ

2. МОДЕЛЬ "СУЩНОСТЬ-СВЯЗЬ"

2.1 Многоуровневые представления данных

2.2 Информация о сущностях и связях (уровень 1)

2.3 Структура информации (уровень 2)

3. ДИАГРАММА "СУЩНОСТЬ-СВЯЗЬ" И ВКЛЮЧЕНИЕ СЕМАНТИКИ В ОПИСАНИЕ ДАННЫХ И МАНИПУЛИРОВАНИЕ ДАННЫМИ

3.1 Системный анализ с использованием диаграммы "сущность-связь"

3.2 Пример проектирования и описания базы данных

3.3 Целостность данных

3.4 Семантика и множественные операции запросов выборки информации

3.5 Семантика и правила вставки, удаления и модификации

4. АНАЛИЗ ДРУГИХ МОДЕЛЕЙ ДАННЫХ И ИХ ПОРОЖДЕНИЕ ИЗ МОДЕЛИ "СУЩНОСТЬ-СВЯЗЬ"

4.1 Реляционная модель

4.2 Сетевая модель

4.3 Модель множества сущностей

БЛАГОДАРНОСТИ
Литература

Предлагается модель данных, называемая моделью "сущность-связь" (entity-relationship model). Эта модель основывается на некоторой важной семантической информации о реальном мире. Вводится специальный диаграммный метод как средство проектирования баз данных. Приводится пример проектирования и описания базы данных с использованием этой модели и диаграммного метода. Обсуждаются некоторые аспекты понятий целостности данных, поиска информации и манипуляций с данными.

Модель "сущность-связь" может использоваться в качестве основы для унификации различных представлений данных на основе сетевой модели, реляционной модели и модели набора сущностей. Анализируются семантические неоднозначности, возникающие в этих моделях. Представлены возможные способы порождения этих представлений данных из модели "сущность-связь".

Ключевые слова и фразы: "проектирование баз данных", "локальное представление данных", "семантика данных", "модели данных", "модель "сущность-связь"", "реляционная модель", "Data Base Task Group", "сетевая модель", "модель набора сущностей", "определение данных и манипуляция ими", "целостность и согласованность данных". CR-категории: 3.50, 3.70, 4.33, 4.34.

1. ВВЕДЕНИЕ

В настоящее время логическое представление данных является важной проблемой. Были предложены три основных модели данных: сетевая модель [2,3,7], реляционная модель [8] и модель набора сущностей [25]. Эти модели имеют свои сильные и слабые стороны. Сетевая модель обеспечивает более естественное представление данных, разделяя (до определенной степени) сущности и связи, однако возможности этой модели по обеспечению независимости данных подвергаются сомнению [8]. Реляционная модель основывается на теории реляционных баз данных и может обеспечить высокую степень независимости данных, но при ее использовании может быть упущена некоторая важная информация о реальном мире [12,15,23]. Модель набора сущностей, основанная на теории множеств, также обеспечивает высокую степень независимости данных, но принятое в ней представление значений, таких как "3" или "red", кому-то может показаться неестественным[25].

В этой статье представлена модель "сущность-связь", которая обладает большинством преимуществ упомянутых выше моделей. В модели "сущность-связь" используется более естественное представление, в соответствии с которым реальный мир состоит из "сущностей" и "связей". Эта модель основывается на некоторой важной семантической информации о реальном мире (описание других результатов, связанных с семантикой баз данных, могут быть найдены в [1,12,15,21,23 и 29]). Модель может обеспечить высокую степень независимости данных и основывается на теории множеств и реляционной теории.

Модель "объект-связь" может использоваться в качестве основы для унифицированного представления данных. В большинстве предыдущих работ делался акцент на различиях между сетевой и реляционной моделями [22]. В настоящее время предпринимаются попытки сократить различия между тремя моделями данных [4,19,26,30,31]. В этой статье модель "сущность-связь" используется в качестве основы, из которой могут быть порождены три существующие модели данных. Читатель может рассматривать модель "сущность-связь" как обобщение или расширение существующих моделей.

Статья состоит из трех частей (разделы 2-4). В разделе 2 вводится модель "сущность-связь" на основе использования многоуровневых представлений данных. В разделе 3 описывается семантическая информация в этой модели и ее использование для описания данных и манипуляций данными. В качестве средства проектирования баз данных вводится специальный диаграммный метод - "диаграммы "сущностей-связей"". В разделе 4 анализируются сетевая модель, реляционная модель и модель набора сущностей и описывается, как они могут быть выведены из модели "сущность-связь".

2. МОДЕЛЬ "СУЩНОСТЬ-СВЯЗЬ"

2.1. Многоуровневые представления данных

При изучении модели данных мы должны распознать логические представления данных, к которым имеет отношение эта модель. Расширяя базовый набор результатов, опубликованных в [18,25], мы можем определить четыре уровня представления данных (рис. 1):

(1) Информация, относящаяся к объектам и связям, которые существуют в нашем воображении.

(2) Структура информации - организация информации, в которой объекты и связи представляются данными.

(3) Структура данных, независимая от способа доступа, - структуры данных, которые не связаны со схемами поиска, индексации и др.

(4) Структура данных, зависимая от способа доступа.

В следующих подразделах мы будем шаг за шагом разрабатывать модель "сущность-связь" для первых двух уровней. Как мы увидим позже, сетевая модель в том виде, в котором она существует в настоящее время, в основном относится к уровню 4, реляционная модель в основном относится к уровням 3 и 2, а модель множества объектов в основном относится к уровням 1 и 2.

Рисунок 1.
Анализ моделей данных с использованием нескольких уровней логических представлений

2.2. Информация о сущностях и связях (уровень 1)

На этом уровне мы рассматриваем сущности и связи. Сущность (entity) - это "предмет", который может быть идентифицирован некоторым способом, отличающим его от других "предметов". Конкретные человек, компания или событие являются примерами сущности. Связь (relationship) - это ассоциация, устанавливаемая между сущностями. Например, "отец - сын" - это связь между двумя сущностями "человек". База данных предприятия содержит информацию о сущностях и связях, которые представляют интерес для этого предприятия. В базу данных предприятия не может быть занесено полное описание сущности или связи. Невозможно (и, по всей видимости, не обязательно) сохранять всю потенциально доступную информацию о сущностях и связях.¹⁾ Далее мы будем рассматривать только те сущности и связи (и информацию о них), которые должны войти в проект базы данных.

2.2.1 Сущность и набор сущностей. Пусть Е обозначает сущность, которая существует в нашем воображении. Каждая сущность относится к некоторому отличному от других набору сущностей (entity set), таким как EMPLOYEE, PROJECT или DEPARTMENT. С каждым набором сущностей связывается предикат, позволяющий проверить, принадлежит ли сущность данному набору. Например, если мы знаем, что сущность относится к набору сущностей EMPLOYEE, то мы также знаем, что эта сущность обладает свойствами, общими с другими сущностями из набора объектов EMPLOYEE. В число этих свойств входит упомянутый выше предикат. Пусть Ei обозначает набор сущностей. Заметим, что наборы сущностей не обязаны быть непересекающимися. Например, сущность, принадлежащая набору объектов MALE-PERSON (МУЖЧИНЫ), принадлежит также и набору сущностей PERSON (ЛЮДИ). В этом случае MALE-PERSON является подмножеством PERSON.

2.2.2 Связь, роль и набор связей. Рассмотрим ассоциации сущностей. Набор связей (relationship set) Ri - это математическое отношение [5] между n сущностями, каждая из которых относится к некоторому набору сущностей:

{[e₁, e₂, ...,e_n | e₁ принадл E₁, 
e₂ принадл E₂, ..., e_n принадл E_n},

и каждый кортеж сущностей, [e₁,e₂,...e_n], является связью (relationship). Заметим,что в этом определении не обязаны быть различными наборами. Например, "marriage" (брак) - это связь между двумя сущностями из набора сущностей PERSON (ЧЕЛОВЕК).

Роль (role) сущности в связи - это функция, которую сущность выполняет в данной связи. "Husband" (муж) и "wife" (жена) - это роли. Упорядочивание сущностей в определении связи (заметим,что использовались квадратные скобки) может отсутствовать, если в связи явно указаны роли сущностей: (r₁/e₁,r₂/e₂,...,r_n/e_n), где r_i - это роль сущности e_i в данной связи.

2.2.3 Атрибут, значение и набор значений. Информацию об объекте или связи получают путем наблюдения или измерения и выражают множеством пар "атрибут-значение". "3", "red", "Peter" и "Johnson" - это значения. Значения классифицируются в различные наборы значений (value sets), такие как FEET, COLOR, FIRST-NAME и LAST-NAME. С каждым набором значений связывается предикат для проверки того, принадлежит ли значение этому набору. Значение из некоторого набора значений может быть эквивалентно другому значению из другого набора значений. Например, "1₂" из набора значений INCH (дюймы) эквивалентно "1_e" в множестве значений FEET (футы).

Атрибут (attribute) может быть формально определен как функция, отображающая набор сущностей или набор связей в набор значений или Декартово произведение наборов значений:

f: E_i или R_i -> V_i или V_i1 х V_i2 х ... х V_in

На рис. 2 показаны несколько атрибутов, определенных на множестве объектов PERSON. Атрибут AGE (ВОЗРАСТ) производит отображение в набор значений NO-OF-YEARS (ЧИСЛО-ЛЕТ). Атрибут может задавать отображение в Декартово произведение наборов значений. Например, атрибут NAME (ПОЛНОЕ-ИМЯ) задает отображение в множества значений FIRST-NAME (ИМЯ) и LAST-NAME (ФАМИЛИЯ). Заметим, что несколько атрибутов могут задавать отображение одного и того же набора объектов в один и тот же набор значений (или одну и ту же группу набора значений). Например, атрибуты NAME (ПОЛНОЕ-ИМЯ) и ALTERNATIVE-NAME (ДРУГОЕ-ПОЛНОЕ-ИМЯ) задают отображение из множества объектов EMPLOYEE в наборы значений FIRST-NAME и LAST-NAME. Тем самым, атрибут и набор значений являются различными понятиями, хотя в некоторых случаях они могут иметь одно и то же имя (например, атрибут EMPLOYEE-NO (НОМЕР-СЛУЖАЩЕГО) задает отображение из EMPLOYEE (СЛУЖАЩИЕ) в набор значений EMPLOYEE-NO (НОМЕР-СЛУЖАЩЕГО)). Это различие не является явным в сетевой модели и во многих существующих системах управления данными. Заметим также, что атрибут определяется как функция. Следовательно, он отображает данный объект в одно значение (или один набор значений в случае Декартова произведения наборов значений).

Рисунок 2.
Атрибуты, определенные на наборе сущностей PERSON

Заметим, что связи также имеют атрибуты. Рассмотрим множество связей PROJECT-WORKER (ИСПОЛНИТЕЛЬ-ПРОЕКТА) (рис. 3). Атрибут PERCENTAGE-OF-TIME (ПРОЦЕНТ-ВРЕМЕНИ), представляющий долю времени, выделенную конкретному служащему на конкретный проект,- это атрибут, определенный на наборе связей PROJECT-WORKER. Он не является ни атрибутом сущности EMPLOYEE, ни атрибутом сущности PROJECT, так как его смысл зависит и от служащего, и от проекта. Понятие атрибута связи важно для понимания семантики данных и определения функциональных зависимостей между данными.

Рисунок 3.
Атрибуты, определенные на наборе связей PROJECT-WORKER

2.2.4 Концептуальная структура информации. Теперь мы рассмотрим, как организовать информацию о сущностях и связях. В этой статье предложен метод разделения информации о сущностях и информации о связях. Мы покажем, что такое разделение полезно для идентификации функциональных зависимостей между данными.

На рис. 4 в форме таблицы приведена информация о сущностях в наборе сущностей. Каждая строка значений относится к одной и той же сущности, а каждый столбец относится к множеству значений, которое, в свою очередь, относится к атрибуту. Порядок строк и столбцов неважен.

Рисунок 4.
Информация о сущностях из набора сущностей (табличная форма)

Рисунок 5.
Информация о связях из набора связей (табличная форма)

На рис. 5 приведена информация о связях в наборе связей. Заметим, что каждая строка значений относится к связи, которая показана группой сущностей, где каждая имеет определенную роль и принадлежит определенному набору объектов.

Заметим, что на рис. 4 и 2 (а также на рис. 5 и 3) представлены различные формы одной и той же информации. Форма таблицы используется для простоты связи с реляционной моделью.

2.3. Структура информации (уровень 2)

Сущности, связи и значения на уровне 1 (см. рис. 2-5) являются концептуальными объектами, существующими в нашем воображении (т.е. мы находились в концептуальной области). На уровне 2 мы рассматриваем представления концептуальных объектов. Мы предполагаем, что существуют непосредственные представления значений. Далее мы опишем, как представляются сущности и связи.

Рисунок 6.
Представление сущностей значениями (номерами служащих)

2.3.1 Первичный ключ. На рис. 2 значения атрибута EMPLOYEE-NO могут использоваться для идентификации сущностей в наборе сущностей EMPLOYEE, если каждый служащий имеет отдельный номер служащего. Возможно, для идентификации сущностей в наборе сущностей понадобится более одного атрибута. Возможно также, что для идентификации сущностей будут использоваться несколько групп атрибутов. По существу, ключ сущности (entity key) - это группа атрибутов, такая, что отображение из набора сущностей в соответствующую группу наборов значений является взаимнооднозначным отображением. Если не удается найти такое отображение на доступных данных, или если желательна простота в идентификации объектов, можно искусственно определить атрибут и набор значений, чтобы добиться наличия взаимнооднозначного отображения. В случае существования нескольких ключей обычно выбирается семантически значимый ключ в качестве первичного ключа сущности (entity primary key - PK).

Рис. 6 получен объединением набора сущностей EMPLOYEE с набором значений EMPLOYEE-NO с рис. 2. Обратим внимание на некоторые семантические импликации на рисунке 6. Каждое значение в множестве значений EMPLOYEE-NO представляет объект (служащего). Атрибуты задают отображение из множества значений EMPLOYEE-NO в другие множества значений. Заметим также, что атрибут EMPLOYEE-NO задает отображение из множества значений EMPLOYEE-NO в самого себя.

2.3.2 Отношения "объект/связь". Информация об объектах в наборе объектов теперь может быть организована в форме, показанной на рис. 7. Заметим, что рис. 7 аналогичен рис. 4, за исключением того, что объекты представлены значениями их первичных ключей. Вся таблица на рис. 7 представляет отношение сущностей (entity relation), а каждая строка представляет кортеж сущностей (entity tuple).

Рисунок 7.
Регулярное отношение сущностей EMPLOYEE

Так как связь идентифицируется вовлекаемыми в нее сущностями, первичный ключ связи (primary key of a relationship) может быть представлен основными ключами вовлеченных в связь сущностей. На рис. 8 вовлеченные сущности представлены их первичными ключами EMPLOYEE-NO и PROJECT-NO. Имена ролей задают семантический смысл значений в соответствующих столбцах. Заметим, что EMPLOYEE-NO - это первичный ключ вовлеченных в связь сущностей, а не атрибут связи. PERCENTAGE-OF-TIME - это атрибут связи. Таблица на рис. 8 представляет отношение связей (relationship relation), а каждая строка значений - кортеж связей.(relationship tuple).

Рисунок 8.
Регулярное отношение связей PROJECT-WORKER

В некоторых случаях сущности в наборе сущностей нельзя уникально идентифицировать значениями их собственных атрибутов; следовательно, для их идентификации мы должны использовать связь(и). Например, рассмотрим сущности служащих-подчиненных (dependent) и служащих-начальников (supporter): подчиненные идентифицируются своими именами и значениями основного ключа служащих-начальников (т.е. их связями с этими служащими). Заметим, что на рис. 9 EMPLOYEE-NO не является атрибутом объекта в наборе DEPENDENT, а представляет собой первичный ключ служащих, которые имеют подчиненных. Каждая строка значений на рис. 9 - это кортеж сущностей с EMPLOYEE-NO и NAME в качестве первичных ключей. Вся таблица является отношением сущностей.

Теоретически, любой вид связи может использоваться для идентификации сущностей. Для простоты мы ограничимся только одним видом связи: бинарными связями с отображением 1:n, в которых существование n сущностей на одной стороне связи зависит от существования одной сущности на другой стороне связи. Например, один служащий может иметь n (n = 0, 1, 2,... ) подчиненных, и существование подчиненных зависит от существования соответствующего служащего.

Этот метод идентификации сущностей связями с другими сущностями можно применять рекурсивно до тех пор, пока не встретятся сущности, которые могут быть идентифицированы значениями своих собственных атрибутов. Например, основной ключ департамента компании может состоять из номера департамента и основного ключа отделения, который в свою очередь состоит из номера отделения и имени компании.

Следовательно, мы имеем две формы отношений сущностей. Если связи используются для идентификации объектов, мы будем называть это слабым отношением сущностей (weak entity relation) (рис. 9). Если связи не используются для идентификации сущностей, мы будем называть это регулярным отношением сущностей (regular entity relation) (рис. 8). Если некоторые сущности в связи идентифицируются другими связями, мы будем называть это слабым отношением связей (weak relationship relation). Например, любые связи между сущностями DEPENDENT и другими сущностями приведут к образованию слабых отношений связи, так как сущность DEPENDENT идентифицируется своим именем и связью с сущностью EMPLOYEE. Проведение различия между регулярными (сущность/связь) и слабыми (сущность/связь) отношениями будет полезно для поддержки целостности данных.

Рисунок 9.
Слабое отношение сущностей DEPENDENT

3. ДИАГРАММА "СУЩНОСТЬ-СВЯЗЬ" И ВКЛЮЧЕНИЕ СЕМАНТИКИ В ОПИСАНИЕ ДАННЫХ И МАНИПУЛИРОВАНИЕ ДАННЫМИ

3.1. Системный анализ с использованием диаграммы "сущность-связь"

В этом разделе мы вводим диаграммный метод для представления сущностей и связей: - диаграмму "сущность-связь".

__DECLARE       VALUE-SETS      REPRESENTATION  ALLOWABLE-VALUES 
                        EMPLOYEE-NO     INTEGER(4)              (0,2000) 
                        FIRST-NAME      CHARACTER(8)    ALL 
                        LAST-NAME       CHARACTER(10)   ALL 
                        NO-OF-YEARS     INTEGER(3)              (0,100) 
                        PROJECT-NO      INTEGER(3)              (1,500) 
                        PERCENTAGE      FIXED(5.2)              (0,100.00) 

__DECLARE       REGULAR ENTITY RELATION _.EMPLOYEE 
                        __ATTRIBUTE/VALUE-SET_.: 
                                EMPLOYEE-NO/EMPLOYEE-NO
                                                NAME(FIRST-NAME,LAST-NAME) 
                                                ALTERNATIVE-NAME/(FIRST-NAME,LAST-NAME) 
                                AGE/NO-OF-YEARS

                        __PRIMARY KEY_.: 
                                EMPLOYEE-NO

__DECLARE       REGULAR ENTITY RELATION _.PROJECT 
                        __ATTRIBUTE/VALUE-SET_.: 
                                PROJECT-NO/PROJECT-NO 

                        __PRIMARY KEY_.: 
                                PROJECT-NO 

__DECLARE               REGULAR RELATIONSHIP RELATION _.PROJECT-WORKER 
                        __ROLE/ENTITY-RELATION.PK/MAX-NO-OF-ENTITIES 
                                WORKER/EMPLOYEE.PK/n 
                                PROJECT/PROJECT.PK/m (отображение m:n) 
                        __ATTRIBUTE/VALUE-SET_.: 
                                PERCENTAGE-OF-TIME/PERCETNTAGE 

__DECLARE               WEAK RELATIONSHIP RELATION _.EMPLOYEE-DEPENDENT 
                        __ROLE/ENTITY-RELATION.PK/MAX-NO-OF-ENTITIES 
                                SUPPORTER/EMPLOYEE.PK/1 
                                DEPENDENT/DEPENDENT.PK/n 
                        __EXISTENCE OF _.DEPENDENT__ DEPENDENS ON 
                                __EXISTENCE OF _.SUPPORTER 

__DECLARE               WEAK ENTITY RELATION _.DEPENDENT 
                        __ATTRIBUTE/VALUE-SET_.: 
                                NAME/FIRST-NAME 
                                AGE/NO-OF-YEARS 
                        __PRIMARY KEY_.: 
                                NAME 
                                EMPLOYEE.PK __THROUGH_. EMPLOYEE-DEPENDENT

Рисунок 10.
Простая диаграмма сущность-связь

На рис. 10 с использованием диаграммного метода демонстрируются набор связей PROJECT-WORKER и наборы связей EMPLOYEE и PROJECT. Каждый набор сущностей представляется прямоугольником, а каждый набор связей - ромбом. Линии, соединяющие прямоугольники, демонстрируют тот факт, что набор связей PROJECT-WORKER определен на наборах сущностей EMPLOYEE и PROJECT. Указаны роли сущностей в связи.

На рис. 11 приведена более полная диаграмма некоторых наборов сущностей и наборов связей, которые могли бы представлять интерес для производственной компании. DEPARTMENT, EMPLOYEE, DEPENDENT, PROJECT, SUPPLIER и PART - это множества сущностей. DEPARTMENT-EMPLOYEE, EMPLOYEE-DEPENDENT, PROJECT-WORKER, PROJECT-MANAGER, SUPPLIER-PROJECT-PART, PROJECT-PART и COMPONENT - множества связей. Связь COMPONENT показывает, какие детали (и в каком количестве) требуются для создания составных деталей. Смысл других множеств связей не нуждается в объяснении.

На рис. 11 можно обнаружить несколько важных общих характеристик связей:

(1) Набор связей может быть определен на более чем двух наборах сущностей. Например, множество связей SUPPLIER-PROJECT-PART определяется на трех наборах сущностей: SUPPLIER, PROJECT и PART.

(2) Набор связей может быть определен и только на одном наборе сущностей. Например, набор связей COMPONENT определяется на единственном наборе объектов PART.

(3) Может существовать несколько наборов связей, определенных на заданных наборах сущностей. Например, наборы связей PROJECT-WORKER и PROJECT-MANAGER определяются на наборах сущностей PROJECT и EMPLOYEE.

(4) В диаграмме могут различаться отображения 1:n, m:n и 1:1. Набор связей DEPARTMENT-EMPLOYEE является отображением 1:n, т.е. в одном департаменте может работать n (n = 0, 1, 2, ...) служащих, и каждый служащий работает только на один департамент. Набор связей PROJECT-WORKER является отображением m:n, т.е. в каждом проекте могут участвовать ноль, один и более служащих, и каждый служащий может участвовать в ноле, одном или более проектах. Можно выразить также отображение 1:1, такое, каким является набор связей MARRIAGE. Информация о допускаемом набором связей числе сущностей в каждом наборе сущностей задается с помощью указания в диаграмме "1", "m", "n". Реляционная модель и модель множества объектов²⁾ не включают этот тип информации; в сетевой модели невозможно просто выразить отображение 1:1.

(5) В диаграмме можно показать зависимость существования (existence dependency) одного типа сущностей от другого. Например, стрелка в наборе связей EMPLOYEE-DEPENDENT показывает, что существование сущности в наборе сущностей DEPENDENT зависит от соответствующей сущности в наборе сущностей EMPLOYEE. Другими словами, если служащий покидает компанию, его подчиненные, возможно, больше не будут представлять интерес.

Рисунок 11.
Диаграмма сущность-связь для анализа информации в производственной компании

Заметим, что набор сущностей DEPENDENT показан специальным прямоугольником. Это значит, что на уровне 2 информация о сущностях из этого набора организована как слабое отношение сущностей (с использованием первичного ключа EMPLOYEE как части первичного ключа DEPENDENT).

3.2. Пример проектирования и описания базы данных

При проектировании базы данных с использованием модели "сущность-связь" выполняются четыре шага: (1) идентификация представляющих интерес наборов сущностей и наборов связей; (2) идентификация семантической информации в наборах связей, например, является ли некоторый набор связи отображением 1:n; (3) определение наборов значений и атрибутов; (4) организация данных в виде отношений "сущность/связь" и определение первичных ключей.

Будем использовать в качестве примера производственную компанию, рассмотренную в разд. 3.1. Результаты первых двух шагов проектирования базы данных отражены в диаграмме "сущность-связь", показанной на рис. 11. Третий шаг состоит в определении набора значений и атрибутов (см. рис. 2 и 3). На четвертом шаге принимается решение о первичных ключах сущностей и связей, и данные организуются в виде отношений "сущность/связь". Заметим, что для каждого набора сущностей на рис. 11 имеется соответствующее отношение "сущность/связь". Мы будем использовать имена наборов сущностей (на уровне 1) как имена соответствующих отношений "сущность/связь" (на уровне 2), если только это не вызывает путаницы.

В конце этого раздела мы показываем схему (определение данных) для небольшой части базы данных из упомянутого выше примера производственной компании (синтаксис определения данных не представляет особой важности). Заметим, что наборы значений определяются с указанием представлений и допустимых значений. Например, значения в EMPLOYEE-NO представляются как целые из 4 цифр с диапазоном значений от 0 до 2000. Затем мы объявляем три отношения сущностей: EMPLOYEE, PROJECT и DEPENDENT. Указываются атрибуты и множества значений, определенные на наборах сущностей, а также первичные ключи. DEPENDENT - это слабое отношение сущностей, так как частью его первичного ключа является EMPLOYEE.PK. Мы также объявляем два отношения связей: PROJECT-WORKER и EMPLOYEE-DEPENDENT. Указываются роли и вовлекаемые в связи сущности. Мы используем EMPLOYEE.PK для именования отношения сущностей (EMPLOYEE), и подходящие пары атрибут-набор значений используются как первичные ключи в этом наборе сущностей. Устанавливается максимальное число сущностей из набора сущностей в отношении. Например, PROJECT-WORKER является отображением m:n. Мы можем указать значения m и n. Можно также задать не только максимальное число сущностей, но и их минимальное число. EMPLOYEE-DEPENDENT - это слабое отношение связей, так как одно из входящих в это отношение связей отношение сущностей DEPENDENT является слабым отношением сущностей. Заметим, что также указывается зависимость существования подчиненных от их начальника.

Уровень 1	Уровень 2
Операция вставить обьект в набор сущностей	Операция Создать набор сущностей с некоторым PK-сущности проверка PK уже существует или принимается
Операция вставить связь в набор связей проверка существует ли сущность	Операция создать набор связей с данными PK объектов проверка существует ли PK объектов
Операция вставить свойство сущности или связи проверка применимо ли значение	Операция вставить значени в набор сущностей или набор связей проверка применимо ли значение

Уровень 1	Уровень 2
Операция - изменить значение аттрибута сущности	Операция - модифицировать значение аттрибута сущности Следствие - если это не часть PK сущности, следствий нет - если это часть PK сущности, -- изменить PK сущностей во всех связанных отношениях связи -- изменить PK других сущностей, которые используют это значение как часть своих PK, например в PK сущностей DEPENDENT используется PK сущности EMPLOYEE
Операция - изменить значение аттрибута связи	Операция - модефицировать значение (заметим, что аттрибут связи не будет PK связи)
Операция - удалить сущность Следствие - удалить любую сущность, существование которой зависит от этой сущности - удалить все связи, включающие эту сущность - удалисть все связанные свойства	Операция - удалить кортеж сущностей Следствие - удалить любой набор сущностей, существование которого зависит от этого набора сущностей - удалить наборы связей, ассоциированные с этой сущностью
Операция - удалить связь Следствие - удалить все связанные свойства	Операция - удалить набор связей

3.3. Целостность данных

По поводу целостности данных была проделана некоторая работа в рамках других моделей [8,14,16,28]. При наличии в модели "сущность-связь" явных понятий сущности и связи эта модель будет полезна для понимания и спецификации ограничений, направленных на поддержки целостности данных. Например, имеется три основных типа ограничений на значения:

(1) Ограничения на допустимые значения (allowable values) в наборе значений. Этот вопрос обсуждался при определении схемы в разделе 3.2.

(2) Ограничения на разрешенные (permitted) значения для некоторого атрибута. В некоторых случаях не все допустимые значения из набора значений являются разрешенными для некоторых атрибутов. Например, возраст служащих может быть ограничен диапазоном значений от 20 до 65, т.е.

        AGE(e) принадл (20,65), 
        где e принадл EMPLOYEE 

Заметим, что для более ясного выражения семантики мы используем нотации уровня 1. Так как для каждого набора "сущность/связь" имеется соответствующее отношение "сущность/связь", приведенное выше выражение можно легко перевести в нотации уровня 2.

(3) Ограничения на существующие значения (existing values) в базе данных. Имеется два типа ограничений:

(i) Ограничения на наборы существующих значений. Например:

{ NAME(e) | e принадл 
MALE_PERSON } 
входит в { NAME(e) | e принадл 
MALE_PERSON } 


(ii) Ограничения на конкретные значения.

Например:

TAX ( e ) < = S A L A R Y 
( e ) , e 
принадл EMPLOYEE или 
BUDGET(ei) = Sum BUDGET(ej), 
где ei принадл COMPANY 
ej принадл DEPARTMENT 
[ei,ej] принадл COMPANY-DEPARTMENT 

3.4. Семантика и множественные операции запросов выборки информации

Семантика запросов выборки информации становится совершенно очевидной, если запросы основываются на модели данных "сущность-связь". Для ясности мы вначале обсудим ситуацию на уровне 1. Концептуально, элементы информации организованы так, как показано на рис. 4 и 5 (на рис. 2 и 3). Многие запросы выборки информации могут рассматриваться как комбинация следующих базисных типов операций:

(1) Выбор поднабора значений из набора значений.

(2) Выбор поднабора сущностей из набора сущностей (т.е. выбор некоторых строк на рис. 4). Сущности выбираются с помощью указания значений некоторых атрибутов (т.е. поднаборов наборов значений) и/или их связей с другими сущностями.

(3) Выбор поднабора связей из набора связей (т.е. выбор некоторых строк на рис. 5). Связи выбираются с помощью указания значений некоторого(ых) атрибута(ов) и/или путем идентификации некоторых объектов в связи.

(4) Выбор поднабора атрибутов (т.е. выбор столбцов на рис. 4 и 5).

Запрос выборки информации, такой как "Каков возраст служащих, чей вес больше 170 и которые работают над проектом со значением атрибута PROJECT-NO, равным 254?", может быть выражен следующим образом:

{AGE(e) | e принадл EMPLOYEE, 
WEIGHT(e) > 170, 
[ei,ej] принадл PROJECT-WORKER, 
ej принадл PROJECT, 
PROJECT-NO(ej) = 254}; или 
{AGE(EMPLOYEE) | WEIGHT(EMPLOYEE) 
> 170, 
[EMPLOYEE,PROJECT] принадл 
PROJECT-WORKER, 
PROJECT-NO(EMPLOYEE) = 254}; 

Для выборки информации на уровне 2, организованной так, как показано на рис. 6, "сущности" и "связи" в (2) и (3) должны быть заменены "первичные ключи (PK - Primary Key) сущностей" и "PK связей". Приведенный выше запрос выборки информации может быть выражен как:

{AGE(EMPLOYEE.PK) | WEIGHT
(EMPLOYEE.PK) > 170, 
(WORKER/EMPLOYEE.PK, 
PROJECT/PROJECT.PK) принадл 
{PROJECT-WORKER.PK}, 
PROJECT-NO(PROJECT.PK) = 254}; 

Для выборки информации, организованной в виде отношений сущность/связь (рис. 7, 8 и 9) мы можем использовать язык, подобный Sequel [6]:

SELECT AGE 
FROM   EMPLOYEE 
WHERE WEIGHT > 170 AND EMPLOYEE.PK = 
      SELECT
WORKER/EMPLOYEE.PK 
FROM  PROJECT-WORKER 
WHERE PROJECT-NO = 254. 

Можно выбирать информацию о сущностях из двух различных наборов сущностей без указания связи между ними. Например, запрос выборки информации "Перечислить имена служащих и кораблей (ship), которые имеют одинаковый возраст", в нотации уровня 1 может быть выражен следующим образом:

{(NAME(ei),NAME(ej))|ei        принадл
EMPLOYEE, ej принадл SHIP,
AGE(ei)=AGE(ej)}. 

Здесь мы больше не будем обсуждать синтаксис языка. Мы только хотим подчеркнуть, что запросы информации можно выразить, используя понятия множества и операции над множествами [17], и семантика запросов совершенно очевидна, если принять эту точку зрения.

3.5. Семантика и правила вставки, удаления и модификации

Поддержка согласованности данных после вставки, удаления и модификации данных в базе данных всегда представляет сложную проблему. Одна из основных причин заключается в том, что семантика и последствия операций вставки, удаления и модификации обычно четко не определяются; поэтому трудно найти набор правил, которые могут поддерживать согласованность данных. Мы покажем,что проблема согласованности данных упрощается при использовании модели "сущность-связь".

В таблицах I-III мы обсуждаем семантику и правила³⁾ операций вставки, удаления и модификации и на уровне 1, и на уровне 2. Уровень 1 используется для того, чтобы семантика была более ясной.

4. АНАЛИЗ ДРУГИХ МОДЕЛЕЙ ДАННЫХ И ИХ ПОРОЖДЕНИЕ ИЗ МОДЕЛИ "СУЩНОСТЬ-СВЯЗЬ"

4.1. Реляционная модель

4.1.1 Реляционное представление данных и неоднозначность семантики. В реляционной модели отношение (relation) R - это математическое отношение, определенное на множествах X₁, X₂, ..., X_n:

R = {(x₁,x₂,...x_n) | x₁ принадл X₁,
x₂ принадл X₂,...,x_n принадл X_n}

Множества X₁,X₂,...,X_n называются доменами (domains), а (x₁, x₂, ..., x_n) называется кортежем (tuple). На рис. 12 показано отношение EMPLOYEE. Доменами отношения являются EMPLOYEE-NO, FIRST-NAME, LAST-NAME, FIRST-NAME, LAST-NAME, NO-OF-YEAR. Порядок строк и столбцов в отношении не является существенным. Чтобы избежать неоднозначности столбцов отношения с одним и тем же доменом, имена доменов уточняются ролями (roles) (для выделения роли домена в отношении). Например, в отношении EMPLOYEE, домены FIRST-NAME и LAST-NAME можно уточнить ролями LEGAL или ALTERNATIVE. Имя атрибута (attribute name) в реляционной модели - это имя домена и присоединенное к нему имя роли [10]. Сравнивая рис. 12 и 7, мы можем заметить, что "домены" почти эквивалентны наборам значений. Хотя может показаться, что "роль" и "атрибут" в реляционной модели служат той же цели, что и "атрибут" в модели "сущность-связь", семантика этих терминов различается. "Роль" и "атрибут" в реляционной модели используются главным образом для того, чтобы различать домены с одним и тем же именем в одном и том же отношении, в то время как "атрибут" в модели "сущность-связь" - это функция, задающая отображение из набора сущностей (или связей) в набор(ы) значений.

Рисунок 12.
Отношение EMPLOYEE

Рисунок 13.
Отношение EMPLOYEE-PROJECT

Использование реляционных операторов в реляционной модели может вызывать семантические неоднозначности. Например, в результате соединения отношения EMPLOYEE с отношением EMPLOYEE-PROJECT (рис. 13) по домену EMPLOYEE-NO получается отношение EMPLOYEE-PROJECT" (рис. 14). Но какой смысл имеет соединение отношения EMPLOYEE с отношением SHIP по домену NO-OF-YEARS? Проблема состоит в том, что одно и то же имя домена может иметь различную семантику в различных отношениях (заметим, что роль предназначена для различения доменов в данном отношении, а не во всех). Если не допускается, чтобы значения домена NO-OF-YEAR отношения EMPLOYEE были сравнимыми со значениями домена NO-OF-YEAR отношения SHIP, должны быть объявлены различные имена доменов. Но если такие сравнения допустимы, сможет ли система баз данных предупредить пользователя?

Рисунок 14.
Отношение EMPLOYEE-PROJECT" как "соединение" отношений EMPLOYEE и EMPLOYEE-PROJECT

Рисунок 15.
Отношение SHIP

В модели "сущность-связь" семантика данных гораздо более очевидна. Например, один столбец в рассмотренном выше примере содержит значения AGE объекта EMPLOYEE, а другой столбец содержит AGE объекта SHIP. Если эта семантическая информация предоставлена пользователю, он может действовать более предусмотрительно (сошлемся на образцы запросов выборки информации из разд. 3.4). Поскольку система баз данных содержит семантическую информацию, ей следует обладать возможностью предупреждать пользователя о потенциальных проблемах предложенной выше операции типа соединения.

4.1.2 Семантика функциональных зависимостей между данными. В реляционной модели "атрибут" B отношения функционально зависим (functionally dependent) от "атрибута" A того же отношения, если каждому значению A соответствует не более, чем одно значение B. Семантика функциональных зависимостей между данными становится очевидной в модели "сущность-связь". По существу, имеется два основных типа функциональных зависимостей:

(1) Функциональные зависимости, относящиеся к описанию сущностей или связей. Поскольку атрибут определяется как функция, он отображает сущность из набора сущностей в одно значение из набора значений (см. рис. 2). На уровне 2 для представления сущностей используются значения первичного ключа. Следовательно, неключевые наборы значений функционально зависимы от наборов значений первичного ключа (например, на рис. 6 и 7 NO-OF-YEARS функционально зависим от EMPLOYEE-NO). Поскольку отношение может иметь несколько ключей, неключевые наборы значений будут функционально зависимыми от любого ключевого набора значений. Ключевые наборы значений будут взаимно функционально зависеть друг от друга. Аналогично, в отношении связей неключевые наборы значений будут функционально зависимы от наборов значений первичного ключа (например, на рис. 8 PERCENTAGE функционально зависим от EMPLOYEE-NO и PROJECT-NO).

(2) Функциональные зависимости, относящиеся к сущностям в связи. Заметим, что на рис. 11 мы указываем типы отображений (1:n, m:n, и т.д.) для наборов связей. Например, PROJECT-MANAGER является отображением 1:n. Допустим, что PROJECT-NO - это первичный ключ в отношении сущностей PROJECT. В отношении связей PROJECT-MANAGER набор значений EMPLOYEE-NO будет функционально зависим от набора значений PROJECT-NO (т.е. для каждого проекта имеется только один менеджер).

Проведение различия между уровнем 1 (рис. 2) и уровнем 2 (рис. 6 и 7) и разделение отношения сущностей (рис. 7) и отношения связей (рис. 8) вносит ясность в семантику функциональных зависимостей между данными.

4.1.3 3NF-отношения 3NF в сравнении с отношениями "сущность-связь". Из определения "отношения" следует, что любое группирование доменов можно рассматривать как отношение. Чтобы избежать нежелательных свойств в поддерживаемых отношениях, предлагается процесс нормализации, в ходе которого произвольные отношения преобразуются в первую нормальную форму, затем во вторую нормальную форму и, наконец, в третью нормальную форму (3NF) [9,11]. Мы покажем, что отношения сущностей и связей в модели "сущность-связь" похожи на 3NF-отношения, но обладают более ясной семантикой и не требуют выполнения операций преобразования.

Будем использовать упрощенную версию примера нормализации, описанного в [9]. Следующие три отношения находятся в первой нормальной форме (т.е. не включают домена, элементы которого сами являлись бы отношениями):

EMPLOYEE (__EMPLOYEE-NO_.) 
PART (__PART-NO_., 
PART-DESCRIPTION, QUANTITY-ONHAND) 
PART-PROJECT (__PART-NO_., 
__PROJECT-NO_., PROJECT-
DESCRIPTION, PROJECT-MANAGER-NO, 
QUANTITY-COMMITED)

Заметим, что домен PROJECT-MANAGER-NO (номер менеджера проекта) реально содержит EMPLOYEE-NO (номер служащего) менеджера проекта. В показанных выше отношениях первичные ключи подчеркнуты.

В соответствии с определенными правилами эти отношения преобразуются в третью нормальную форму:

EMPLOYEE" (__EMPLOYEE-NO_.) 
PART" (__PART-NO_., 
PART-DESCRIPTION, QUANTITY-ONHAND) 
PROJECT" (__PROJECT-NO_., 
PROJECT-DESCRIPTION, 
PROJECT-MAN AGER-NO) 
PART-PROJECT" (__PART-NO_., 
__PROJECT-NO_., QUANTITY-COMMITED) 

Используя диаграмму "сущность-связь" с рис. 11, можно легко вывести следующие отношения сущностей и связей:

сущность     PART"" (__PART-NO_.,
PART-DESCRIPTION, QUANTITY-ONHAND) 
отношения  PROJECT"" (__PROJECT
NO_., PROJECT-DESCRIPTION) 
EMPLOYEE""(__EMPLOYEE-NO_.) 
связь      PART-PROJECT""
(__PART/PART-NO_., __PROJECT/PRO
JECT-NO_., QUANTITY-COMMITED) 
отношения  PROJECT-
MANAGER""(__PROJECT/PROJECT-NO_., 
__MANAGER/EMPLOYEE-NO_.) 


Указываются имена ролей сущностй в связях (такие как MANAGER). Имена отношений сущностей, ассоциированных с первичными ключами сущностей в связях, и имена наборов значений пропущены.

Заметим, что в приведенном выше примере отношения "сущность-связь" похожи на 3NF-отношения. При использовании подхода 3NF PROJECT-MANAGER-NO включается в отношение PROJECT", поскольку предполагается, что PROJECT-MANAGER-NO функционально зависим от PROJECT-NO. В модели "сущность-связь" PROJECT-MANAGER-NO (т.е. EMPLOYEE-NO менеджера проекта) включается в отношение связи PROJECT-MANAGER, так как в этом случае EMPLOYEE-NO рассматривается как первичный ключ сущности.

Заметим также, что при использовании подхода 3NF изменения функциональных зависимостей данных могут приводить к тому, что некоторые отношения перестают находиться в 3NF. Например, если мы делаем новое предположение, что для одного проекта могут быть несколько менеджеров, отношение PROJECT" больше не будет 3NF-отношением, и его нужно будет разбить на два отношения - PROJECT"" и PROJECT-MANAGER"". При использовании модели "сущность-связь" такие изменения не являются необходимыми. Следовательно, мы можем сказать, что используя модель объект-связь мы можем привести данные к форме, аналогичной 3NF-отношениям, но с отчетливым семантическим смыслом.

Интересно отметить, что описанный выше подход декомпозиции (или преобразования) для нормализации отношений можно рассматривать как подход "снизу-вверх" в проектировании базы данных⁴⁾. При использовании этого подхода все начинается с произвольных отношений (уровень 3 на рис. 1), а затем используется некоторая семантическая информация (функциональные зависимости данных) для преобразования этих отношений в 3NF-отношения (уровень 2 на рис. 1). В модели "сущность-связь" принят подход "сверху-вниз", в котором используется семантическая информацию для организации данных в отношения "сущность/связь".

4.2. Сетевая модель

Рисунок 16.
Связь DEPARTMENT-EMPLOYEE (а) диаграмма структур данных ,(б) диаграмма "сущность-связь"

Рисунок 17.
Связь PROJECT-WORKER (а) диаграмма структур данных, (б) диаграмма "сущность-связь"

4.2.1 Семантика диаграммы структур данных. Один из лучших способов объяснения сетевой модели состоит в использовании диаграммы структур данных (data-structure diagram)[3]. На рис. 16 показана диаграмма структур данных. Каждый прямоугольник представляет тип записи. Стрелка представляет набор структур данных, в котором запись DEPARTMENT является записью-владельцем (owner-record), и одной записи-владельцу может соответствовать n (n = 0, 1, 2, ...) записей-членов (member-records). На рис. 16(б) приведена диаграмма "сущность-связь". Можно было бы заключить, что стрелка на диаграмме структур данных показывает связь между сущностями в двух наборах сущностей. Это не всегда верно. На рис. 17(а) и 17(б) показана диаграмма структур данных и диаграмма "сущность-связь", выражающие связь PROJECT-WORKER между двумя типами сущностей - EMPLOYEE и PROJECT. На рис. 17(а) мы можем видеть, что связь PROJECT-WORKER становится другим типом записи, и что стрелки больше не представяют связь между сущностями. Каков реальный смысл стрелок на диаграммах структур данных? Ответ состоит в том, что стрелка представляет связь 1:n между двумя типами записи (а не сущности), и из ее наличия также следует существование пути доступа из записи-владельца к записям-членам. Диаграмма структур данных - это представление организации записей (уровень 4 на рис. 1); оно не является точным представлением объектов и связей.

4.2.2 Порождение диаграммы структур данных. При каких условиях стрелка в диаграмме структур данных соответствует связи сущностей? Тесное сравнение диаграмм структур данных с соответствующими диаграммами "сущность-связь" позволяет вывести следующие правила:

Для бинарных связей 1:n стрелка используется для представления связи (см. рис. 16(а)).
Для бинарных связей m:n для представления связи создается тип "запись связи", и рисуются стрелки из типа "запись сущности" в тип "запись связи" (см. рис. 16(а)).
Для k-арных связей (k>=3) применяется то же правило, что и в случае (2) (т.е. создание типа "запись связи").

Рисунок 18.
Набор-структур-данных, определенных на одном типе записи

Рисунок 19.
Связь MARRIAGE (а) диаграмма структур данных, (б) диаграмма "сущность-связь"

Поскольку в DBTG [7] не разрешается определить набор структур данных на одном типе записи (т.е., не допустим рис. 18, хотя он реализован в [13]), для реализации таких связей необходима "запись связи" (см. рис. 19(а)) [20]. Соответствующая диаграмма "сущность-связь "показана на рис. 19(б).

Теперь ясно, что стрелки на диаграмме структур данных не всегда представляют связи сущностей. Даже в том случае, когда стрелка представляет связь 1:n, она показывает только однонаправленную связь [20] (хотя имеется возможность найти запись-владельца по записи-члену). В модели "сущность-связь" представляются оба направления связи (специфицируются роли обеих сущностей). Помимо семантической неоднозначности стрелок, недостатком сетевой модели является неудобство обработки изменений семантики. Например, если связь между DEPARTMENT и EMPLOYEE из отображения 1:n превращается в отображение m:n (т.е. один служащий может принадлежать нескольким департаментам), в сетевой модели мы должны создать запись связи DEPARTMENT-EMPLOYEE. В модели "сущность-связь" все типы отображений обрабатываются единообразно.

Модель "сущность-связь" можно применять как средство при структурном проектировании баз данных с использованием сетевой модели. Вначале пользователь рисует диаграмму "сущность-связь" (рис. 11). Он может просто перевести ее в диаграмму структур данных (рис. 20), используя указанные выше правила. Пользователь может также следовать дисциплине, в соответствии с которой каждая сущность или связь должны отображаться в запись (то есть, "записи связей" создаются для всех типов связей, независимо от того, являются они отображениями 1:n или m:n). Таким образом, все, что нужно сделать на рис. 11 - это заменить ромбы на прямоугольники и добавить концы стрелок к соответствующим линиям. При использовании такого подхода на рис. 20 появятся еще три прямоугольника - DEPARTMENT-EMPLOYEE, EMPLOYEE-DEPENDENT И PROJECT-MANAGER (см. рис. 21). Ограничения, рассмотренные в разд. 3.3-3.5, также будут полезны.

Рисунок 20.
Диаграмма структур данных, выведенная из диаграммы "сущность-связь" с рис. 11

Рисунок 21.
"Упорядоченная" диаграмма структур данных, выведенная из диаграммы "сущность-связь" с рис. 11

4.3. Модель множества сущностей

4.3.1 Представление множества сущностей. Базовый элемент модели множества сущностей - это "сущность". Сущности имеют имена (имена объектов), такие как "Peter Jones", "blue" или "22". Имена сущностей, имеющих некоторые общие свойства, собираются в множества-имен-сущностей, которые именуются именами-множеств-имен-сущностей, например, "NAME", "COLOR" и "QUANTITY".

Сущность представляется парой "имя-множества-имен-сущностей/имя-сущности", например, NAME/Peter Jones, EMPLOYEE-NO/2566 и NO-OF-YEARS/20. Сущность описывается своей связью с другими сущностями. Рис. 22 иллюстрирует представление данных в модели множества сущностей. "DEPARTMENT" сущности EMPLOYEE-NO/2566 - это сущность DEPARTMENT-NO/405. Другими словами, "DEPARTMENT" - это роль, которую играет сущность DEPARTMENT-NO/405 для описания сущности EMPLOYEE-NO/2566. Аналогично, "NAME", "ALTERNATIVE-NAME" или "AGE" сущности EMPLOYEE-NO/2566 - это "NAME/Peter Jones", "NAME/Sam Jones" или "NO-OF-YEARS/20" соответственно. Описание сущности EMPLOYEE-NO/2566 - это набор связанных сущностей и их ролей (сущности и роли обведены пунктирной линией). Пример описания сущности "EMPLOYEE-NO/2566" представлен на рис. 23 набором триплетов имя-роли/имя-множества-имен-сущностей/имя-сущности. Концептуально, модель множества сущностей отличается от модели "сущность-связь" следующим:

(1) В модели множества сущностей все трактуется как объекты. Например, "COLOR/BLACK" и "NO-OF-YEARS/45" - это сущности. В модели "сущность-связь" "blue" и "36" обычно трактуются как "значения". Заметим, что обработка значений как объектов может порождать семантические проблемы. Например, на рис. 22, какова разница между "EMPLOYEE-NO/2566", "NAME/Peter Jones" и "NAME/Same Jones"? Представляют ли они различные объекты?

(2) В модели множества сущностей используются только бинарные связи⁵⁾, в то время как в модели "сущность-связь" можно использовать n-арные связи.

Рисунок 22.
Представление множества объектов

Рисунок 23.
Описание сущностей в модели множества сущностей

4.3.2 Вывод представления множества сущностей. Одна из главных трудностей в понимании модели множества сущностей вытекает из ее представления мира (т.е. идентификации значений с помощью сущностей). Модель "сущность-связь", предложенная в этой статье, полезна в понимании и выводе представления данных в модели множества сущностей. Рассмотрим рис. 2 и 6. На рис. 2 сущности представлены как ei (которые существуют в нашем воображении или реально). На рис. 6 объекты представлены значениями. Модель множества сущностей работает и на уровне 1 и на уровне 2, но мы будем объяснять ее представление на уровне 2 (рис. 6). В модели множества сущностей все наборы значений, такие как NO-OF-YEARS, трактуются как "множества-имен-сущностей", а все значения как "имена сущностей". В модели множества сущностей атрибуты становятся именами ролей. Для бинарных связей перевод прост: роль сущности в связи (например, роль "DEPARTMENT" в связи DEPARTMENT-EMPLOYEE) становится именем роли сущности в описании роли другой сущности в связи (см. рис. 22). Для n-арных (n > 2) связей мы должны искусственно создавать сущности для связей, чтобы трактовать эти связи как бинарные.

БЛАГОДАРНОСТИ

Автор хочет выразить свою благодарность Джорджу Мили, Стюарту Мэднику, Мюрею Эдельбергу, Сьюзан Брюер, Стевену Тоду и рецензентам за их важные предложения (рис. 21 был предложен одним из рецензентов). Поводом к написанию этой статьи послужил ряд дискуссий с Чарльзом Бечменом. Автор также признателен Е.Ф.Кодду и М.Е.Сенко за их важные комментарии и обсуждения при проверке этой статьи.

Литература

Abrial, J.R. Data semantics. In Data Base Management, J.W. Klimbie and K.L. Koffeman, Eds.,North-Holland Pub. Co., Amsterdam, 1974, pp. 1-60.
Bachman, C.W. Software for random access processing. Datamation 11 (April 1965), 36-41.
Bachman, C.W. Data structure diagrams. Data Base 1,2 (Summer 1969), 4-10.
Bachman, C.W. Trends in database management - 1975. Proc., AFIPS 1975 NCC, Vol.44, AFIPS Press, Montvale, N.J., pp. 569-576.
Birkhoff, G., and Bartee, T.C. Modern Applied Algebra. McGraw-Hill, New York, 1970.
Chamberlin, D.D., and Raymond, F.B. SEQUEL: A structured English query language. Proc. ACM-SIGMOD 1974, Workshop, Ann Arbor, Michigan, May, 1974.
CODASYL. Data base task group report. ACM, New York, 1971.
Codd, E.F. A relational model of data for large shared data banks. Comm. ACM 13,6 (June 1970), 377-387.
Codd, E.F. Normalized data base structure: a brief tutorial. Proc. ACM-SIGFIDET 1971, Workshop, San Diego, Calif., Nov. 1971, pp. 1-18.
Codd, E.F. A data base sublanguage founded on the relational calculus. Proc. ACM-SIGFIDET 1971, Workshop, San Diego, Calif., Nov. 1971, pp. 35-68.
Codd, E.F. Recent investigations in relational data base systems . Proc. IFIP Congress 1974, North-Holland Pub. Co., Amsterdam, pp. 1017-1021.
Deheneffe, C., Hennebert, H., and Paulus, W. Relational model for data base. Proc. IFIP Congress 1974, North-Holland Pub. Co., Amsterdam, pp.1022-1025.
Dodd, G.G. APL - a language for associate data handling in PL/I. Proc. AFIPS 1966 FGCC, Vol. 29, Spartan Books, New York, pp. 677-684.
Eswaran, K.P. and Chamberlin, D.D. Functional specifications of a subsystem for data base integrity. Proc. Very Large Data Base Conf., Framingham, Mass., Sept. 1975, pp. 48-68.
Hainaut, J.L. and Lecharlier, B. An extensible semantic model of data base and its data language. Proc. IFIP Congress 1974, North-Holland Pub. Co., Amsterdam, pp. 1026-1030.
Hammer, M.M., and McLeod, D.J. Semantic integrity in a relation data base system. Proc. Very Large Data Base Conf., Framingham, Mass., Sept. 1975, pp.25-47.
Lindgreen, P. Basic operations on information as a basis for data base design. Proc. IFIP Congress 1974, North-Holland Pub. Co., Amsterdam, pp.993-997.
Mealy, G.H. Another look at data base. Proc. AFIPS 1967 FJCC, Vol. 31, AFIPS Press, Montvale, N.J., pp. 525-534.
Nijssen, G.M. Data structuring in the DDL and the relational model. In Data Base Management, J.W. Klimbie and K.L. Koffeman, Eds., North-Holland Pub. Co., Amsterdam, 1974, pp. 363-379.
Olle, T.W. Current and future trends in data base management systems. Proc. IFIP Congress 1974, North-Holland Pub. Co., Amsterdam, pp. 998-1006.
Roussopoulos, N., and Mylopoulos, J. Using semantic networks for data base management. Proc. Very Large Data Base Conf., Framingham, Mass., Sept. 1975, pp. 144-172.
Rustin, R. (Ed.). Proc. ACM-SIGMOD 1974 - debate on data models. Ann Arbor, Mich., May 1974.
Schmid, H.A., and Swenson. J.R. On the semantic of the relational model. Proc. ACM-SIGMOD 1975, Conference, San Jose, Calif., May 1975, pp.211-233.
Senko, M.E. Data description language in the concept of multilevel structured description: DIAM II with FORAL. In Data Base Description, B.C.M. Dougue, and G.M. Nijssen, Eds., North-Holland Pub. Co., Amsterdam, pp.239-258.
Senko, M.E., Altman, E.B., Astrahan, M.M., and Fehder, P.L. Data structures and accessing in data base systems. IBM Syst. J. 12,1 (1973), 30-93.
Sibley, E.H. On the equivalence of data base systems. Proc. ACM-SIGMOD 1974 debate on data models, Ann Arbor, Mich., May 1974, pp. 43-76.
Steel, T.B. Data Base standartization - a status report. Proc. ACM-SIGMOD 1975, Conference, San Jose, Calif., May 1975, pp. 65-78.
Stonebraker, M. Implementation of integrity constraints and views by query modification. Proc. ACM-SIGMOD 1975, Conference, San Jose, Calif., May 1975, pp. 65-78.
Sundgren, B. Conceptual foundation of the infological approach to data bases. In Data Base Management, J.W. Klimbie and K.L. Koffeman, Eds., North-Holland Pub. Co., Amsterdam, 1974, pp. 61-95.
Taylor, R.W. Observations on the attributes of database sets. In Data Base Description, B.C.M. Dougue and J.M. Nijssen, Eds., North-Holland Pub. Co., Amsterdam, pp.73-84.
Tsichritzis, D. A network framework for relation implementation. In Data Base Description, B.C.M. Dougue and J.M. Nijssen, Eds., North-Holland Pub. Co., Amsterdam, pp. 269-282.

^*) Переведено из ACM Transactions on Database Systems, v.1, #1, 1976 с разрешения ACM

¹⁾ Возможно, некоторые люди могут относиться к чему-либо (например, браку) как к сущности, а другие будут считать это связью. Мы думаем, что в таких случаях решение должно приниматься администрацией предприятия [27]. Эти люди должны определить, что является сущностями, а что - связями, чтобы это разделение соответствовало особенностям конкретной среды.

²⁾ Такая информация об отображениях поддерживается в DIAM II [24].

³⁾ Наша основная цель состоит в том, чтобы проиллюстрировать семантику операций манипулирования данными. Поэтому эти правила могут быть неполными. Заметим, что последствия операций, указанные в таблицах, могут поддерживаться системой, а не пользователями.

⁴⁾ Хотя подходу декомпозиции придается особое значение в литературе, посвященной реляционной модели, этот подход представляет собой процедуру получения 3NF и не является свойством, внутренне присущим 3NF.

⁵⁾ Хотя подходу декомпозиции придается особое значение в литературе, посвященной реляционной модели, этот подход представляет собой процедуру получения 3NF и не является свойством, внутренне присущим 3NF.