Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые проекты » Інформаційні ресурси Інтернет, пов'язані з області бізнесу і комерції

Реферат Інформаційні ресурси Інтернет, пов'язані з області бізнесу і комерції





у БД. p> Такі мови називають інформаційно-пошуковими. В даний час розроблено досить велику кількість інформаційно-пошукових мов , які відрізняються не тільки за своїми образотворчим властивостями, але і по ступеня семантичної сили.

В основі підходу до побудови класифікаційних мов лежить уявлення про те, що накопичені знання можуть бути розділені на взаємовиключні класи і підкласи. Існує система правил, якою повинен підкорятися будь-яку мову класифікаційного типу, зокрема:

- Ділення галузей знань на класи і підкласи проводиться за однією підставою;

- Підкласи повинні виключати один одного;

- При діленні класів на підкласи повинна дотримуватися безперервність.

Інформаційно - пошукові мови, що отримали назву дескрипторних, засновані на застосуванні принципів координатного індексування, при якому смислове зміст документа може бути з певним ступенем точності і повноти задано списком ключових слів, що містяться в тексті.

дескрипторного мови прив'язані до лексики текстів. Ключові слова з текстів вибираються виходячи з різних цілей, відповідно, критерії вибору можуть змінюватися. Для побудови дескрипторного мови критерієм відбору ключових слів, як правило, служать інформативність слова і частота його зустрічальності в тексті.

Універсальними структурами дескрипторного мови є лексичні одиниці, парадигматичні та синтагматичні відношення.

Лексична одиниця - найменша смислова одиниця, що задається при побудові мови.

У більшості автоматизованих інформаційних систем при індексуванні документів і запитів застосовується контроль за допомогою тезауруса. Контроль може здійснюватися в автоматизованому або ручному режимі. По суті справи тезаурус являє собою словник - довідник, в якому присутні всі лексичні одиниці дескрипторного інформаційно пошукового мови з введеними парадигматическими відносинами. Парадигматичні відносини можуть задаватися як:

В· Відносини вид - рід (вищестоящий дескриптор);

В· Відносини рід - вид (нижчестоящі дескриптори);

В· Синоніми;

В· Асоціативні зв'язку

У тезауруси поміщаються дескриптори і недескріптори, хоча існують тезауруси тільки з дескрипторів.

Як дескриптори, так і недескріптори приводять до єдиної граматичної формі. Як правило, дескриптори вживаються у формі іменників або іменних словосполучень. Тезаурус може бути побудований за принципом дескрипторних статей, що складалися з заголовного дескриптора і списку дескрипторів і недескріпторов з позначенням парадигматичних відносин. Тезаурус може бути двомовним. У цьому випадку еквівалентний дескриптор іноземною мовою повинен бути позначений.

Парадигматичні відносини являють собою внетекстовие відносини між лексичними одиницями. На їх підставі відбувається угруповання лексичних одиниць у парадигми.

Синтагматические відносини являють собою відносини лексичних одиниць у тексті, тобто вони виражають семантику контексту.

При перекладі основного смислового змісту документів і запитів з природної мови на дескрипторна інформаційно - пошуковий мова існують певні правила, звані системою індексування. Результатом перекладу документа є пошуковий образ документа , а запиту - пошуковий образ запиту.

З перерахованих інформаційно - пошукових мов саме дескрипторні мови найкращим чином пристосовані для опису документів і запитів при автоматизованому пошуку в текстових БД. Мови ці володіють таким перевагою, як гнучкість, відкритість, близькість до природної мови; це мови дворівневі (рівень ключових слів і рівень дескрипторів). Дескрипторні інформаційно - пошукові мови дозволяють формулювати документи і запити в різних термінах. До основних недоліків мов даного класу можна віднести недостатню повноту опису смислового змісту документів і запитів. p> Системи, контрольовані тезаурусом, містять процедури як морфологічного, так і синтаксичного аналізу текстів. Однак при проектуванні ряду БД виникає необхідність у додаванні ще одного етапу аналізу тексту на природній мові - аналізу його семантичної структури. Прикладом таких баз можуть бути БД, орієнтовані на пошук по зразкам. У подібних семантичних системах намагаються моделювати процес розуміння закінчених описів фрагментів дійсності, наприклад патентів, оповідань, епізодів та ін, виражених у вигляді текстів. Як правило, розуміння тексту трактується як процес вилучення з нього істотною з точки зору системи інформації. Витягнута інформація вводиться в базу знань, що представляє собою динамічну інформаційну модель реального світу. Потім система здатна відповідати на запити щодо подій, фактів, явищ, викладених у текстах.

Пакети прикладних програм, призначені для введення, обробки, пошуку та оновлення текстів, називають інформаційно-пошукової системою (ІПС).


5. Мережеві бази даних.

Одним з...


Назад | сторінка 3 з 11 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Особливості при перекладі технічних текстів з англійської мови на російську ...
  • Реферат на тему: Використання інформаційно-комунікативних технологій як фактор підвищення як ...
  • Реферат на тему: Особливості мови медичного науково-популярного тексту і проблеми перекладу ...
  • Реферат на тему: Прийоми і використання різних видів текстів на уроках англійської мови
  • Реферат на тему: Міжособистісні відносини в сім'ях з дітьми дошкільного віку, що мають п ...