в автоматизованому або ручному режимі. По суті справи тезаурус являє собою словник - довідник, в якому присутні всі лексичні одиниці дескрипторного інформаційно пошукового мови з введеними парадигматическими відносинами. Парадигматичні відносини можуть задаватися як:
- Відносини вид - рід (вищестоящий дескриптор);
- Відносини рід - вид (нижчестоящі дескриптори);
- Синоніми;
- Асоціативні зв'язки
У тезауруси поміщаються дескриптори і недескріптори, хоча існують тезауруси тільки з дескрипторів.
Як дескриптори, так і недескріптори приводять до єдиної граматичній формі. Як правило, дескриптори вживаються у формі іменників або іменних словосполучень. Тезаурус може бути побудований за принципом дескрипторних статей, що складалися з заголовного дескриптора і списку дескрипторів і недескріпторов з позначенням парадигматичних відносин. Тезаурус може бути двомовним. У цьому випадку еквівалентний дескриптор іноземною мовою повинен бути позначений.
Парадигматичні відносини являють собою внетекстовие відносини між лексичними одиницями. На їх підставі відбувається угруповання лексичних одиниць у парадигми.
Синтагматические відносини являють собою відносини лексичних одиниць у тексті, тобто вони висловлюють семантику контексту.
При перекладі основного змісту документів і запитів з природної мови на дескрипторна інформаційно - пошуковий мову існують певні правила, звані системою індексування. Результатом перекладу документа є пошуковий образ документа, а запиту - пошуковий образ запиту.
З перерахованих інформаційно - пошукових мов саме дескрипторно мови найкращим чином пристосовані для опису документів і запитів при автоматизованому пошуку в текстових БД. Мови ці володіють такою перевагою, як гнучкість, відкритість, близькість до природної мови; це мови дворівневі (рівень ключових слів і рівень дескрипторів). Дескрипторно інформаційно - пошукові мови дозволяють формулювати документи і запити в різних термінах. До основних недоліків мов даного класу можна віднести недостатню повноту опису смислового змісту документів і запитів.
Системи, контрольовані тезаурусом, містять процедури як морфологічного, так і синтаксичного аналізу текстів. Однак при проектуванні ряду БД виникає необхідність у додаванні ще одного етапу аналізу тексту природною мовою - аналізу його семантичної структури. Прикладом таких баз можуть бути БД, орієнтовані на пошук за зразками. У подібних семантичних системах намагаються моделювати процес розуміння закінчених описів фрагментів дійсності, наприклад патентів, оповідань, епізодів та ін., Виражених у вигляді текстів. Як правило, розуміння тексту трактується як процес вилучення з нього істотною з точки зору системи інформації. Вилучення інформації вводиться в базу знань, що представляє собою динамічну інформаційну модель реального світу. Потім система здатна відповідати на запити щодо подій, фактів, явищ, викладених у текстах.
Пакети прикладних програм, призначені для введення, обробки, пошуку та оновлення текстів, називають інформаційно-пошуковою системою (ІПС).
.2 Види БД
.2.1 Мережеві бази даних
Одним з найбільш ефективних методів представлення знань є мережні моделі.
В основі моделей лежить поняття мережі, вершинами якої є поняття, що відповідають об'єктам, подій, процесів, явищ, а дугами - відносини між цими поняттями.
Вузли та зв'язку можна наочно зображати у вигляді діаграм.
Якщо вершини мережі не мають своєї внутрішньої структури, то мережа буде простою. Якщо ж вершини мають деякою структурою у вигляді мережі, то мережа називається ієрархічної. Якщо відносини між вершинами однакові, то мережа однорідна, в іншому випадку - мережа неоднорідна. Характер відносин, приписуваний дугам, може бути різний. Відповідно до цього виділяють такі типи мереж:
- Функціональні мережі відображають декомпозицію певної обчислювальної або інформаційної процедури, а дуги показують функціональну зв'язок між декомпонірованнимі частинами; ця мова недостатньо багатий для представлення знань;
- Сценарії, що представляють собою однорідні мережі з єдиними ставленням у вигляді несуворого порядку. Семантика відносин може бути різною. Ставлення може трактуватися як класифікує, тимчасове і т.п. Сценарії часто використовуються при формуванні допустимих планів по досягненню мети;
- Семантичні мережі використовують відносини різних типів, а вершини в них можуть мати різну інтерпретацію, По суті справи семантична мережа є класом, до яко...