изначити інформаційні потреби БД;
- Проаналізувати об'єкти, які потрібно промоделювати в БД.
Основні типи моделей даних
Ядром будь-якої бази даних є модель даних. Модель даних представляє собою безліч структур даних, обмежень цілісності і операцій маніпулювання даними. За допомогою моделі даних можуть бути представлені об'єкти предметної області, взаємозв'язку між ними. Модель даних - це сукупність структур даних і операцій їх обробки. Сучасна СУБД базується на використанні ієрархічної, мережевої, реляційної і об'єктно-орієнтованої моделях даних, комбінації цих моделей або на деякій їх підмножині.
Розглянемо три основних типи моделей даних : ієрархічну, мережеву, реляціоннную і об'єктно-орієнтовану. p> Ієрархічна модель даних. Ієрархічна структура представляє сукупність елементів, пов'язаних між собою по певними правилами. Об'єкти, пов'язані ієрархічними відносинами, утворюють орієнтований граф (перевернуте дерево), приклад якого надається на рис.2. До основних понять ієрархічної структури відносяться: рівень, елемент (Вузол), зв'язок. Ієрархічну модель організовує дані у вигляді деревовидної структури. Вузол - це сукупність атрибутів даних, що описують деякий об'єкт. На схемі ієрархічного дерева вузли мають вигляд вершин графа. Кожен вузол на більш низькому рівні пов'язаний тільки з одним вузлом, який знаходиться на більш високому рівні. Ієрархічне дерево має тільки одну вершину (корінь дерева), яка не підпорядкована ніякий інший вершині. Залежні (підлеглі) вузли знаходяться на другому, третьому та інших рівнях. Кількість дерев в базі даних визначається числом кореневих записів.
Мережева модель даних
Мережева модель означає подання даних у вигляді довільного графа. Перевагою мережевої та ієрархічної моделей даних є можливість їх ефективної реалізації за показниками витрат пам'яті й оперативності. Недоліком мережевої моделі даних є висока складність і жорсткість схеми БД, побудованої на її основі.
Реляціоннаяна модель даних. Поняття реляційний (англ. relation - відношення) пов'язаний з розробками відомого американського фахівця в області систем баз даних Е.Ф. Кодда. Ці моделі характеризуються простотою структури даних, зручною для користувача формою подання у вигляді таблиць і можливістю використання апарату алгебри відносин і реляціоннного обчислення для обробки даних.
Мовою математики ставлення визначається таким чином. Нехай задано n множин D1, D2, ..., Dn. Тоді R є відношення над цими множинами, якщо R є множиною впорядкованих наборів виду , де d1 - елемент з D1, d2 - елемент з D2, ... , Dn - елемент з Dn. При цьому набори виду називаються кортежами, а безлічі D1, D2, ... Dn - доменами. Кожен кортеж складається з елементів, які вибираються зі своїх доменів. Ці елементи називаються атрибутами, а їхні значення - значеннями атрибутів.
Отже, реляціоннная модель орієнтована на організацію даних у вигляді двовимірних таблиць, кожна з яких має наступні характеристики:
- кожен елемент таблиці - це один елемент даних;
- всі стовпці в таблиці - однорідні, т.е всі елементи в стовпці мають однаковий тип (символьний, числовий тощо);
- кожен стовпець носить унікальне ім'я;
- однакові рядки в таблиці відсутні.
Таблиці мають рядки, які відповідають записам (або кортежам), а стовпці-атрибутам відносин (доменам, полям).
Наступні терміни є еквівалентними:
ставлення, таблиця, файл (для локальних БД);
кортеж, рядок, запис;
атрибут, стовпчик, поле.
Об'єктно-орієнтовані БД об'єднують в собі дві моделі даних, реляційну і мережеву, і використовуються для створення великих БД зі складними структурами даних.
Реляційна БД є сукупністю відносин, які містять всю необхідну інформацію та об'єднану різними зв'язками.
БД вважається нормалізованої , якщо виконуються наступні умови:
- кожна таблиця має головний ключ;
- всі поля кожної таблиці залежать тільки від головного ключа;
- у таблицях відсутні групи повторних значень.
Для успішної роботи з багатотабличних БД, як правило, треба встановити між ними зв'язки. При цьому користуються термінамімі "базова таблицяВ» (головна) і "підлегла таблицяВ». Зв'язок між таблицями виходить завдяки двох полів, одне з яких знаходиться в базовій таблиці, а друге - у підлеглої. Ці поля можуть мати значення, яке повторюються. Якщо значення у зв'язаному полі запису базової таблиці і в полі підпорядкованої збігаються, то ці записи називаються зв'язаними.
Існують чотири типи відносин між таблицями : один до одного, один до багатьох, багато до одного, б...