тезауруса. Контроль може здійснюватися в автоматизованому або ручному режимі. По суті справи тезаурус являє собою словник - довідник, в якому присутні всі лексичні одиниці дескрипторного інформаційно пошукового мови з введеними парадигматическими відносинами. Парадигматичні відносини можуть задаватися як:
- Відносини вид - рід (вищестоящий дескриптор);
- Відносини рід - вид (нижчестоящі дескриптори);
- Синоніми;
- Асоціативні зв'язку
У тезауруси поміщаються дескриптори і недескріптори, хоча існують тезауруси тільки з дескрипторів.
Як дескриптори, так і недескріптори приводять до єдиної граматичній формі. Як правило, дескриптори вживаються у формі іменників або іменних словосполучень. Тезаурус може бути побудований за принципом дескрипторних статей, що складалися з заголовного дескриптора і списку дескрипторів і недескріпторов з позначенням парадигматичних відносин. Тезаурус може бути двомовним. У цьому випадку еквівалентний дескриптор іноземною мовою повинен бути позначений.
Парадигматичні відносини являють собою внетекстовие відносини між лексичними одиницями. На їх підставі відбувається угруповання лексичних одиниць у парадигми.
Синтагматические відносини являють собою відносини лексичних одиниць у тексті, тобто вони виражають семантику контексту.
При перекладі основного смислового змісту документів і запитів з природної мови на дескрипторна інформаційно - пошуковий мова існують певні правила, звані системою індексування. Результатом перекладу документа є пошуковий образ документа, а запиту - пошуковий образ запиту.
З перерахованих інформаційно - пошукових мов саме дескрипторні мови найкращим чином пристосовані для опису документів і запитів при автоматизованому пошуку в текстових БД. Мови ці володіють такою перевагою, як гнучкість, відкритість, близькість до природної мови; це мови дворівневі (рівень ключових слів і рівень дескрипторів). Дескрипторні інформаційно - пошукові мови дозволяють формулювати документи і запити в різних термінах. До основних недоліків мов даного класу можна віднести недостатню повноту опису смислового змісту документів і запитів.
Системи, контрольовані тезаурусом, містять процедури як морфологічного, так і синтаксичного аналізу текстів. Однак при проектуванні ряду БД виникає необхідність у додаванні ще одного етапу аналізу тексту природною мовою - аналізу його семантичної структури. Прикладом таких баз можуть бути БД, орієнтовані на пошук за зразками. У подібних семантичних системах намагаються моделювати процес розуміння закінчених описів фрагментів дійсності, наприклад патентів, оповідань, епізодів та ін, виражених у вигляді текстів. Як правило, розуміння тексту трактується як процес вилучення з нього істотною з точки зору системи інформації. Вилучення інформації вводиться в базу знань, що представляє собою динамічну інформаційну модель реального світу. Потім система здатна відповідати на запити щодо подій, фактів, явищ, викладених у текстах.
Пакети прикладних програм, призначені для введення, обробки, пошуку та оновлення текстів, називають інформаційно-пошуковою системою (ІПС).
.2 Види БД
.2.1 Мереже...