у БД. p> Такі мови називають інформаційно-пошуковими. В даний час розроблено досить велику кількість інформаційно-пошукових мов , які відрізняються не тільки за своїми образотворчим властивостями, але і по ступеня семантичної сили.
В основі підходу до побудови класифікаційних мов лежить уявлення про те, що накопичені знання можуть бути розділені на взаємовиключні класи і підкласи. Існує система правил, якою повинен підкорятися будь-яку мову класифікаційного типу, зокрема:
- Ділення галузей знань на класи і підкласи проводиться за однією підставою;
- Підкласи повинні виключати один одного;
- При діленні класів на підкласи повинна дотримуватися безперервність.
Інформаційно - пошукові мови, що отримали назву дескрипторних, засновані на застосуванні принципів координатного індексування, при якому смислове зміст документа може бути з певним ступенем точності і повноти задано списком ключових слів, що містяться в тексті.
дескрипторного мови прив'язані до лексики текстів. Ключові слова з текстів вибираються виходячи з різних цілей, відповідно, критерії вибору можуть змінюватися. Для побудови дескрипторного мови критерієм відбору ключових слів, як правило, служать інформативність слова і частота його зустрічальності в тексті.
Універсальними структурами дескрипторного мови є лексичні одиниці, парадигматичні та синтагматичні відношення.
Лексична одиниця - найменша смислова одиниця, що задається при побудові мови.
У більшості автоматизованих інформаційних систем при індексуванні документів і запитів застосовується контроль за допомогою тезауруса. Контроль може здійснюватися в автоматизованому або ручному режимі. По суті справи тезаурус являє собою словник - довідник, в якому присутні всі лексичні одиниці дескрипторного інформаційно пошукового мови з введеними парадигматическими відносинами. Парадигматичні відносини можуть задаватися як:
В· Відносини вид - рід (вищестоящий дескриптор);
В· Відносини рід - вид (нижчестоящі дескриптори);
В· Синоніми;
В· Асоціативні зв'язку
У тезауруси поміщаються дескриптори і недескріптори, хоча існують тезауруси тільки з дескрипторів.
Як дескриптори, так і недескріптори приводять до єдиної граматичної формі. Як правило, дескриптори вживаються у формі іменників або іменних словосполучень. Тезаурус може бути побудований за принципом дескрипторних статей, що складалися з заголовного дескриптора і списку дескрипторів і недескріпторов з позначенням парадигматичних відносин. Тезаурус може бути двомовним. У цьому випадку еквівалентний дескриптор іноземною мовою повинен бути позначений.
Парадигматичні відносини являють собою внетекстовие відносини між лексичними одиницями. На їх підставі відбувається угруповання лексичних одиниць у парадигми.
Синтагматические відносини являють собою відносини лексичних одиниць у тексті, тобто вони виражають семантику контексту.
При перекладі основного смислового змісту документів і запитів з природної мови на дескрипторна інформаційно - пошуковий мова існують певні правила, звані системою індексування. Результатом перекладу документа є пошуковий образ документа , а запиту - пошуковий образ запиту.
З перерахованих інформаційно - пошукових мов саме дескрипторні мови найкращим чином пристосовані для опису документів і запитів при автоматизованому пошуку в текстових БД. Мови ці володіють таким перевагою, як гнучкість, відкритість, близькість до природної мови; це мови дворівневі (рівень ключових слів і рівень дескрипторів). Дескрипторні інформаційно - пошукові мови дозволяють формулювати документи і запити в різних термінах. До основних недоліків мов даного класу можна віднести недостатню повноту опису смислового змісту документів і запитів. p> Системи, контрольовані тезаурусом, містять процедури як морфологічного, так і синтаксичного аналізу текстів. Однак при проектуванні ряду БД виникає необхідність у додаванні ще одного етапу аналізу тексту на природній мові - аналізу його семантичної структури. Прикладом таких баз можуть бути БД, орієнтовані на пошук по зразкам. У подібних семантичних системах намагаються моделювати процес розуміння закінчених описів фрагментів дійсності, наприклад патентів, оповідань, епізодів та ін, виражених у вигляді текстів. Як правило, розуміння тексту трактується як процес вилучення з нього істотною з точки зору системи інформації. Витягнута інформація вводиться в базу знань, що представляє собою динамічну інформаційну модель реального світу. Потім система здатна відповідати на запити щодо подій, фактів, явищ, викладених у текстах.
Пакети прикладних програм, призначені для введення, обробки, пошуку та оновлення текстів, називають інформаційно-пошукової системою (ІПС).
5. Мережеві бази даних.
Одним з...