ентів на природних мовах досить утруднений, виникає питання про проектування деяких формальних мов, призначених для відображення основного смислового змісту документів і запитів в БД.
Такі мови називають інформаційно-пошуковими. В даний час розроблено досить велику кількість інформаційно-пошукових мов, які відрізняються не тільки за своїми образотворчим властивостям, але і за ступенем семантичної сили.
В основі підходу до побудови класифікаційних мов лежить уявлення про те, що накопичені знання можуть бути розділені на взаємовиключні класи і підкласи. Існує система правил, якою повинен підкорятися будь-яку мову класифікаційного типу, зокрема:
Розподіл галузей знань на класи і підкласи проводиться по одній підставі;
Підкласи повинні виключати один одного;
При розподілі класів на підкласи повинна дотримуватися безперервність.
Інформаційно - пошукові мови, що отримали назву дескрипторних, засновані на застосуванні принципів координатного індексування, при якому смисловий зміст документа може бути з певним ступенем точності і повноти задано списком ключових слів, що містяться в тексті.
дескрипторного мови прив'язані до лексики текстів. Ключові слова з текстів вибираються виходячи з різних цілей, відповідно, критерії вибору можуть розрізнятися. Для побудови дескрипторного мови критерієм відбору ключових слів, як правило, служать інформативність слова і частота його зустрічальності в тексті.
Універсальними структурами дескрипторного мови є лексичні одиниці, парадигматичні та синтагматичні відношення.
Лексична одиниця - найменша смислова одиниця, що задається при побудові мови.
У більшості автоматизованих інформаційних систем при індексуванні документів і запитів застосовується контроль за допомогою тезауруса. Контроль може здійснюватися в автоматизованому або ручному режимі. По суті справи тезаурус являє собою словник - довідник, в якому присутні всі лексичні одиниці дескрипторного інформаційно пошукового мови з введеними парадигматическими відносинами. Парадигматичні відносини можуть задаватися як:
1. Відносини вид - рід (вищестоящий дескриптор);
2. Відносини рід - вид (нижчестоящі дескриптори);
. Синоніми;
. Асоціативні зв'язки
У тезауруси поміщаються дескриптори і недескріптори, хоча існують тезауруси тільки з дескрипторів [1,69].
Як дескриптори, так і недескріптори приводять до єдиної граматичній формі. Як правило, дескриптори вживаються у формі іменників або іменних словосполучень. Тезаурус може бути побудований за принципом дескрипторних статей, що складалися з заголовного дескриптора і списку дескрипторів і недескріпторов з позначенням парадигматичних відносин. Тезаурус може бути двомовним. У цьому випадку еквівалентний дескриптор іноземною мовою повинен бути позначений.
Парадигматичні відносини являють собою внетекстовие відносини між лексичними одиницями. На їх підставі відбувається угруповання лексичних одиниць у парадигми.
Синтагматические відносини являють собою відносини лексичних одиниць у тексті, тобто вони виражають семантику контексту.
При перекладі основ...