3.3.3. Неполнота средств идентификации объектов в модели

В теории и практике до сих пор сохраняется двойственное отношение к ФЗ, МЗ и к нормальным формам. С одной стороны, их определение чисто синтаксическое и связано с локальными количественными характеристиками соответствий между атрибутами в данном отношении в определенный момент времени. С другой стороны, понимая недостаток таких "локальных" определений, авторы многих работ связывают с ФЗ и МЗ некие "глобальные", универсальные для всей предметной области характеристики.

Примером этому может служить цитата из работы [3, c. 288]: "... уровень нормализации данного отношения определяется семантикой, а не конкретными значениями данных, в некоторый момент времени. Нельзя с первого взгляда на таблицу с данными для заданного отношения определить, находится оно, например в 3НФ. Для этого также необходимо представлять себе их смысл, т. е. существующие между ними зависимости. Следует также отметить: даже зная о зависимостях данного отношения, нельзя доказать того, что оно находится в 3НФ. В таком случае можно лишь показать, что эти данные не нарушают никаких зависимостей, и, если это так, высказать предположение о том, что эти данные не противоречат гипотезе о принадлежности отношения к 3НФ. Однако этот факт не гарантирует, что предложенная гипотеза верна".

Считая это утверждение по меньшей мере дискуссионным и перенося обсуждение своих аргументов в пользу этой дискуссионности в следующее пособие [3], отметим однако, что одна из бинарных операций алгебры Кодда: соединение по предикату равенства (эквисоединение), - требует для своей истинности именно такой "локальной" формализованности отношений-операндов, наличия в данный момент времени ФЗ или МЗ, определяемых содержанием таблиц этих отношений и фиксируемой ключами отношений. Кодд установил, что эквисоединение семантически верных отношений может дать семантически ложное отношение, при этом пользователь не в состоянии выявить момент появления в базе данных ложной информации.

Напомним, что примером ловушки соединения является отношение R26 (рис. 79) - результат эквисоединения отношений R15 и R25, представленных на рис. 70 и 78.

Известно, что для истинности λ-соединения необходимо, чтобы группы атрибутов в отношениях-операндах, на которых определяется предикат λ, были бы аргументами ФЗ или МЗ. Если же это требование не выполняется, то ловушка соединения нарушает как соответствие логической модели предметной области, так и истинность модели.

В основном, эти противоречия, как выявленные авторами ранее, так и приводимые здесь, сводятся к невозможности установить соответствие между меняющейся предметной областью и традиционной реляционной моделью базы данных.

Известно, что средства нормализации и средства задания ограничений (ФЗ и МЗ) были введены в реляционный подход для отражения части, хотя и малой, семантики реального мира, для устранения избыточности в данных. Так например, в работе [3, c. 281] указывается: "... ФЗ как семантическое понятие. Конечно, ФЗ - это особый вид ограничений целостности, а поэтому это, несомненно семантическое понятие. Распознавание ФЗ является частью процесса выяснения смысла тех или иных данных".

Формулируя эти же идеи по-другому, можно сказать, что ФЗ и МЗ должны выделять сущности (объекты или связи) реального мира, а нормальные формы должны обеспечивать наиболее рациональный способ изображения этих сущностей в базе данных и гарантировать их сохранность.

Остановимся вначале на возможности выделения сущностей реального мира средствами ФЗ и МЗ. При этом будем рассматривать такие зависимости как "глобальные" для базы данных.

Утверждение 1. Имеются сущности, отличные от тех, которые выделяются средствами ФЗ и МЗ [6].

Доказательство. Воспользуемся отношением R6 (рис. 57), где для схемы отношения ПРЕПОДАВАТЕЛЬ (Шифр, Фамилия, Должность, Оклад) определена структура функциональных зависимостей: ШифрФамилия, ШифрДолжность, ШифрОклад и ДолжностьОклад.

Очевидно, что при рассмотрении этого отношения было ошибочным постулирование ФЗ типа: ДолжностьОклад, ибо одной и той же должности обычно соответствует несколько окладов. Также ошибочным было бы постулирование зависимости ОкладДолжность, ибо один оклад может быть одинаковым для разных должностей.
Следовательно, такой важный объект (точнее, конечно, род (класс) объекта), как ТАРИФНАЯ_СТАВКА, представляемый отношением ТАРИФНАЯ_СТАВКА (Должность, Оклад), не выделяется средствами ФЗ.
Аналогичное заключение можно было бы сделать и о МЗ. Действительно, наличие МЗ ДолжностьОклад можно было бы постулировать лишь в том случае, когда в предметной области присутствовали бы все комбинации кортежей отношения ПРЕПОДАВАТЕЛЬ. Например, вместе с кортежами вида < Петров, Преподаватель, 2100 > и < Львов, Ассистент, 1700 > обязаны были бы присутствовать кортежи < Петров, Преподаватель, 1700 > и < Львов, Ассистент, 2100 >. Но это дало бы явное нарушение уникальности имени, не говоря уже о семантике предметной области. Таким образом, объект ТАРИФНАЯ СТАВКА не выделяется ни средствами ФЗ, ни средствами МЗ.

Утверждение 2. Нормализация не обеспечивает сохранение сущностей, которые не выделяются средствами ФЗ и МЗ [6].

Доказательство. Рассмотрим отношение R27(A, B, C, D), представленное на рис. 80.

ABCD
A1B1C1D2
A1B2C1D1
A2B2C1D1
A2B1C1D2
A4B3C2D2
A5B4C3D3
A5B5C3D3
A3B1C2D2
A6B6C3D4

Рис. 80. Отношение R27

Пусть постулированы ФЗ: AC и BD. Тогда легко показать, что атрибуты A и B составляет возможный ключ и, следовательно, оптимальное синтаксическое разложение по алгоритму Неклюдовой - Цаленко [2] будет представлено отношениями R28, R29 и R30, показанными на рис. 81.

AB
A1B1
A1B2
A2B2
A2B1
A4B3
A5B4
A5B5
A3B1
A6B6
AC
A1C1
A2C1
A4C2
A5C3
A3C2
A6C3


BD
B1D2
B2D1
B3D2
B4D3
B5D3
B6D4


Отношение R28Отношение R29 Отношение R30

Рис. 81. Декомпозиция отношения R27

Если в процессе изменения предметной области модифицировать отношение R28, удалив кортеж (а каскадное удаление при этом запрещено), то информация о роде объектов на атрибутах C и D, не выделенном средствами ФЗ, станет неполной: будет невосстановим объект < C3, D4 >, определенный на атрибутах C и D (если, конечно, такой объект самостоятельно существует в описываемой отношением R27 (рис. 80) предметной области).

Случай с МЗ иллюстрируется отношением R31 (A, B, C, D, E), которое представлено на рис. 82. Отношение R31 находится в 3НФ, но не в 4НФ (имеют место нетривиальные МЗ AB и AC,D, а атрибут A не является ключом отношения).

ABCDE
A1B1C1D1E1
A1B1C2D2E1
A2B2C1D2E2
A2B2C2D3E1
A2B3C1D2E2
A2B3C2D3E1

Рис. 82. Отношение R31

Приведение к 4НФ представлено отношениями R32 и R33 (рис. 83).

ACDE
A1C1D1E1
A1C2D2E1
A2C1D2E2
A2C2D3E1
AB
A1B1
A2B2
A2B3
Отношение R32Отношение R33

Рис. 83. Проекции отношения R31

То, что отношения R31 и R32 действительно находятся в 4НФ, можно проверить, доказав, что все их МЗ тривиальны.

Для этого достаточно воспользоваться определением многозначной зависимости Делобеля из работы [11] или Фейджина [10].

Обратите внимание, что для восстановления исходного отношения R31 (рис. 82) из проекций R32 и R33 система должна помнить необычное правило, позволяющее восстанавливать исходное отношение, т.к. в R32 и R33 атрибут A не является ключом.

Теперь после удаления кортежа из отношения R33 становится невосстановимым объект на атрибутах A, C, D который мог быть постулирован многозначной зависимостью AC,D.

Утверждение 3. Нормализация не обеспечивает сохранности сущностей, выделяемых ФЗ и МЗ.

Доказательство. Рассмотрим отношение R34 (A, B, C), показанное на рис. 84. Структура ФЗ, заданных на этом отношении, такова: AB C; AB, CB .

Очевидно, что A1 - ключ. Тогда R34 не находится в 3НФ. Действительно, в проекции R34 [A, B] нет кортежей с одинаковыми значениями из домена атрибута A, так как имеет место AB.

ABC
A1B2C1
A2B1C2
A3B2C1
A4B2C3

Рис. 84. Отношение R34

Допустим, что в отношении R34 все же есть два кортежа с одинаковыми значениями атрибута A.Тогда эти кортежи должны различаться значениями атрибута B из-за ФЗ ABC. Следовательно, в проекции R34 [A, B] встречаются два кортежа с одинаковыми значениями из домена атрибута A, и разными значениями из B, что противоречит наличию заданной зависимости AB.

Следовательно, все кортежи отношения R34 обязаны различаться значениями атрибута A. Отсюда и из АBC следует, что A - ключ и AC, следовательно, имеет место транзитивная зависимость ACB.

Оптимальное синтаксическое разложение приводит к отношениям R35 и R36 (рис.85): R35 = R34 [A, C], R36 = R34 [B, C], из которых исходное отношение R34 восстанавливается эквисоединением R35 [C = C] R36.

AC
A1C1
A2C2
A3C1
A4C3
CB
C1B2
C2B1
C3B1
Отношение R35Отношение R36

Рис. 85. Проекции отношения R34

Теперь, если удалить кортеж из R36, то станет невосстановимой информация об объекте , определявшаяся ФЗ AB.

Доказательство для МЗ проводится аналогично, с необходимыми изменениями (как и утверждения 1 и 2).

Следствие доказанных утверждений состоит в том, что если постулировать зависимости в базе данных как " глобальные ", то не будет обеспечена ни полнота описания предметной области (утверждение 1), ни однозначное соответствие меняющейся предметной области (утверждения 2 и 3).

Если рассматривать зависимости "локально" применительно к данной структуре таблицы (как в п. 3.3.1) данного пособия, то и в этом случае не каждая функциональная зависимость является инвариантом реляционной модели.

Сформулируем выявленные недостатки традиционной реляционной модели:

1. Набор "глобальных" зависимостей не является инвариантом развивающейся логической модели. Понятию "развивающеяся логическая модель" может соответствовать модель, использующая средства, позволяющие полностью описывать и менять описание множества сущностей реальности, сохраняя тем самым требуемое соответствие с реальностью.

2. В результате потери или приобретения " локальных " ФЗ или МЗ в базе данных может произойти непредвиденное или необнаруживаемое заранее появление ложной информации или потеря истинной информации.

3. В базе данных ни одна совокупность атрибутов не может гарантировать однозначный выбор кортежей, так как реляционные ключи могут разрушаться.

4. Двойственность используемых в теории баз данных понятий ФЗ и МЗ и других типов зависимостей, приводит к противоречиям между их семантической " глобальностью " и математической "локальностью", что не дает возможности полностью опираться на эти ограничения при формировании модели предметной области.


[ Назад  Начало раздела  Далее  Содержание]