ді.
пошукова система інформація база
1. Організація зберігання даних
1.1 База даних і система управління базами даних
В даний час кожна серйозна система, метою якої є збір і обробка інформації не може обійтися без власних баз даних (БД) і систем управління базами даних (СКБД).
Системи управління базами даних (СКБД) дають повний контроль над визначенням і обробкою і спільним використанням даних. Такі системи надають всі можливості управління та каталогізації великих обсягів інформації в безлічі таблиць. СУБД забезпечує три основні можливості: визначення даних, обробка даних і управління даними. [1]
· Визначення даних. Можна визначити, які дані будуть зберігатися в базі даних, тип даних (наприклад, текст або число) і зв'язки між ними. У деяких випадках можна задати способи форматування та перевірки допустимості даних.
· Обробка даних. Допускається будь-яке маніпулювання даними. Можна вибирати необхідні поля даних, фільтрувати і сортувати дані. Також можна виконувати злиття пов'язаної інформації і виводити підсумкові дані. Є можливість виділити підмножина даних і попросити СУБД оновити, видалити або скопіювати його в іншу таблицю або створити нову таблицю з цими даними.
· Управління даними. Можна визначати, кому дозволено переглядати, оновлювати і додавати інформацію. У більшості випадків є можливість визначити порядок спільного використання та оновлення даних декількома користувачами.
Існує багато видів і класів БД (і відповідно СУБД), які розрізняються, як і в способі зберігання даних, так і в способі доступу до них і обробки, але розглянемо лише класи БД, які використовуються в пошукових системах:
· Об'єктно-реляційна СУБД;
· Графова СУБД;
Об'єктно-реляційна СУБД - реляційна СУБД (РСУБД), підтримуюча деякі технології, що реалізують об'єктно-орієнтований підхід: об'єкти, класи і спадкування реалізовані в структурі баз даних і мовою запитів.
Об'єктно-реляційними СУБД є, наприклад, широко відомі Oracle Database, Informix, DB2, PostgreSQL. [2]
Мабуть, найпоширеніший клас СУБД, добре себе зарекомендував і використовується практично повсюдно для різних цілей, починаючи з організації телефонного довідника, закінчуючи обробкою надвеликих обсягів даних. Також представники даного класу мають найвищі показники продуктивності при виконанні завдань загального призначення.
Графова база даних - різновид баз даних з реалізацією мережевої моделі у вигляді графа і його узагальнень.
Модель збереження інформації у вигляді графів, графів з властивостями у вузлах і гіперграфів склалася в 1990-2000 роках. Хоча використання графів у вигляді моделі представлення даних склалася набагато раніше, вже в 80-х роках 20-го століття. Першу графову СУБД створили вже у 2007 році (Neo4j). На даний момент існує більше десятка графових СУБД і цей напрямок бурхливо розвивається.
графового модель даних зазвичай розглядають як узагальнення RDF-моделі або мережевий моделі даних. Основними елементами моделі є вузли та зв'язку. Залежно від реа...