Главная страница / 32. Модели данных в информационных систе...: 32.2. Основные понятия ре...

32.2. Основные понятия реляционной модели БД

Для понимания того, как выглядит концептуальная модель в случае использования реляционной модели данных, рассмотрим основных понятия реляционной модели данных.

Любую структуру данных можно преобразовать в двумерную таблицу. Такое представление данных наиболее удобно и для пользователя, и для ЭВМ – подавляющее число современных ИС работает именно с такими таблицами. БД, состоящие из двумерных таблиц, называются реляционными (от англ. relation – отношение).

Основная идея реляционного подхода состоит в том, чтобы представить произвольную структуру данных в виде простой двумерной таблицы. Теория реляционных БД – это сложная математическая дисциплина. Основная терминология БД зависит от уровня описания, конкретного класса системы и категории пользователей. В табл. 32.2 приведены основные термины, характерные для всех вышеперечисленных уровней.

Таблица 32.2. Уровни терминов теории БД

Теория БД
Реляционные БД
Термины конкретной СУБД (например, ACCESS)
Отношение
Таблица
Таблица
Кортеж
Строка
Строка
Атрибут
Столбец
Поле

Совместно с термином «атрибут» часто употребляется термин «домен».

Домен – определяется заданием некоторого базового типа данных, к которому относятся элементы домена, и произвольного логического выражения, применяемого к типу данных. Другими словами, домен – допустимое потенциальное множество значений данного типа, т.е. множество допустимых значений данного атрибута.

Кортеж – это множество пар {имя атрибута, значение}, которое содержит одно вхождение данного имени атрибута, принадлежащего схеме отношения. Значение является допустимым значением домена данного атрибута (или типа данных, если понятие домена не поддерживается). Иначе, кортеж – набор именованных значений заданного типа (строка в отношении).

Строку таблицы также часто называют записью. Далее будем использовать следующие понятия реляционных БД.

Так как отношения являются множествами кортежей, то в них не должны встречаться одинаковые кортежи, и порядок кортежей в отношении несущественен. Обычное представление отношения – таблица, заголовком которой является схема отношения, а строками – кортежи отношения-экземпляра; в этом случае имена атрибутов именуют столбцы этой таблицы. Поэтому иногда говорят «столбец таблицы», имея в виду «атрибут отношения».

Схема отношения – это совокупность наименований атрибутов, представленная в виде заголовка таблицы.

Тип данных.  Это понятие в реляционной модели данных полностью адекватно понятию типа данных в языках программирования. Обычно в современных реляционных БД допускается хранение символьных, числовых данных, битовых строк, специализированных числовых данных («денежные»), а также специальных временных данных, которые являются и числовыми (дата, время, временной интервал).

img321

Рис. 32.1. Пример схемы отношения

Итак, обобщим.

  1. В реляционных БД любые совокупности данных представляются в виде двумерных таблиц.
  2. Каждая таблица состоит из фиксированного числа столбцов и некоторого переменного количества строк. Описание столбцов, которое составляет разработчик, принято называть макетом таблицы.
  3. Каждый столбец представляет собой конкретное данное (например, код изделия, цена изделия и т.д.). Столбцы таблицы называются еще полями, причем для каждого поля разработчик должен определить:  
    • имя поля;
    • тип поля;
    • некоторые дополнительные характеристики (длину, формат и т.д.).
  4. Каждая строка еще называется записью. Система нумерует записи по порядку: 1, 2,3,…, n, где n – общее число записей (строк) в таблице в данный момент. В отличие от количества полей в таблице , количество записей в процессе эксплуатации БД может как угодно меняться. Количество и номенклатуру полей можно изменить, но это уже особая операция, которая называется изменением макета таблицы.
  5. Каждое поле может входить в несколько таблиц.

Каждая запись в таблице должна иметь первичный ключ – идентификатор, значение которого однозначно определяет эту и только эту запись.

Ключ может состоять из одного или нескольких полей. Первичный ключ должен обладать двумя свойствами:

  • однозначная идентификация записи: запись должна однозначно определяться значением ключа;
  • отсутствие избыточности: никакое поле нельзя удалить из ключа, не нарушая при этом свойства однозначной идентификации.

Каждое значение первичного ключа в пределах таблицы должно быть уникальным (в противном случае нельзя отличить одну запись от другой). Например, если объявить в таблице с данными о студентах ключом фамилию студента, может оказаться, что таблица содержит данные об однофамильцах. В этом случае фамилия не будет однозначно идентифицировать запись, поэтому нужно добавить в определение ключа еще и имя и отчество (ключ получится сцепленным). Таким образом, указание первичного ключа – это и есть единственный способ отличить один экземпляр объекта от другого.

Процесс проектирования БД включает несколько этапов. На рис. 32.2 представлена общая схема проектирования БД.

img322

Рис. 32.2. Этапы проектирования БД

Концептуальная схема представляет собой абстрагированное описание предметной области (модель предметной области), заданное в терминах выбранной модели данных. При этом каждая запись модели находится в третьей нормальной форме.

Под физической БД подразумевается схема распределения данных по физическим носителям информации.