Реферат Технологія супутникового та ефірного телебачення на основі підприємства ТОВ "Антенн-Сервіс"

Тема: Новые рефераты

тезауруса. Контроль може здійснюватися в автоматизованому або ручному режимі. По суті справи тезаурус являє собою словник - довідник, в якому присутні всі лексичні одиниці дескрипторного інформаційно пошукового мови з введеними парадигматическими відносинами. Парадигматичні відносини можуть задаватися як:

- Відносини вид - рід (вищестоящий дескриптор);

- Відносини рід - вид (нижчестоящі дескриптори);

- Синоніми;

- Асоціативні зв'язку

У тезауруси поміщаються дескриптори і недескріптори, хоча існують тезауруси тільки з дескрипторів.

Як дескриптори, так і недескріптори приводять до єдиної граматичній формі. Як правило, дескриптори вживаються у формі іменників або іменних словосполучень. Тезаурус може бути побудований за принципом дескрипторних статей, що складалися з заголовного дескриптора і списку дескрипторів і недескріпторов з позначенням парадигматичних відносин. Тезаурус може бути двомовним. У цьому випадку еквівалентний дескриптор іноземною мовою повинен бути позначений.

Парадигматичні відносини являють собою внетекстовие відносини між лексичними одиницями. На їх підставі відбувається угруповання лексичних одиниць у парадигми.

Синтагматические відносини являють собою відносини лексичних одиниць у тексті, тобто вони виражають семантику контексту.

При перекладі основного смислового змісту документів і запитів з природної мови на дескрипторна інформаційно - пошуковий мова існують певні правила, звані системою індексування. Результатом перекладу документа є пошуковий образ документа, а запиту - пошуковий образ запиту.

З перерахованих інформаційно - пошукових мов саме дескрипторні мови найкращим чином пристосовані для опису документів і запитів при автоматизованому пошуку в текстових БД. Мови ці володіють такою перевагою, як гнучкість, відкритість, близькість до природної мови; це мови дворівневі (рівень ключових слів і рівень дескрипторів). Дескрипторні інформаційно - пошукові мови дозволяють формулювати документи і запити в різних термінах. До основних недоліків мов даного класу можна віднести недостатню повноту опису смислового змісту документів і запитів.

Системи, контрольовані тезаурусом, містять процедури як морфологічного, так і синтаксичного аналізу текстів. Однак при проектуванні ряду БД виникає необхідність у додаванні ще одного етапу аналізу тексту природною мовою - аналізу його семантичної структури. Прикладом таких баз можуть бути БД, орієнтовані на пошук за зразками. У подібних семантичних системах намагаються моделювати процес розуміння закінчених описів фрагментів дійсності, наприклад патентів, оповідань, епізодів та ін, виражених у вигляді текстів. Як правило, розуміння тексту трактується як процес вилучення з нього істотною з точки зору системи інформації. Вилучення інформації вводиться в базу знань, що представляє собою динамічну інформаційну модель реального світу. Потім система здатна відповідати на запити щодо подій, фактів, явищ, викладених у текстах.

Пакети прикладних програм, призначені для введення, обробки, пошуку та оновлення текстів, називають інформаційно-пошуковою системою (ІПС).

.2 Види БД

.2.1 Мереже...

Назад | сторінка 11 з 24 | Наступна сторінка

Схожі реферати:

Реферат на тему: Особливості при перекладі технічних текстів з англійської мови на російську ...
Реферат на тему: Міжособистісні відносини в сім'ях з дітьми дошкільного віку, що мають п ...
Реферат на тему: Методи пошуку інформації в мережі інтернет. Інформаційно-пошукові системи ...
Реферат на тему: Особливості мови медичного науково-популярного тексту і проблеми перекладу ...
Реферат на тему: Семантичні мережі. Системи аналізу тексту і синтезу мови

Український реферат переглянуто разів: | Коментарів до українського реферату: 0