Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Семантичні мережі. Системи аналізу тексту і синтезу мови

Реферат Семантичні мережі. Системи аналізу тексту і синтезу мови





має той самий вагу, що і зворотна - від другої до першої. Така відмінність у вагах може вказувати на те, що одна тема є підтемою інший.

Семантична мережа являє собою тематичний індекс аналізованих текстів, який використовується для пошуку документів за темами та їх зв'язків, а також для розширення запиту асоціативно пов'язаними темами. По кожній з тим, мережі формується набір пропозицій тексту - цитат, що відносяться до відповідної теми, які представляють тематичне резюме (реферат) тексту.

Крім того, виконується ранжування цих пропозицій по вагах (від 0 до 100), які відображають їх інформативність для відповідної теми і дозволяють вибрати в резюме лише найбільш інформативні пропозиції. Загальне резюме тексту формується з найбільш інформативних фрагментів по ключових темах документа.

Знання асоціативних зв'язків дозволяє виявити приховані залежності між об'єктами-темами, що цікавлять аналітика - подіями, персоналіями, організаціями тощо.

При аналізі тексту можна скористатися семантичної мережею, побудованою на базі інших текстів (еталонних), або заданої вручну експертом. Наприклад, якщо є семантична мережа, що представляє відому модель предметної області, то її можна використовувати для фільтрації інформації в новинному потоці, виловлюючи в тексті згадки про відомих об'єктах і знаходячи підкріплення відомих взаємозв'язків, а також шукати нові зв'язки між заданими об'єктами.

Робота з семантичною мережею може допомогти аналітику в вирішенні таких завдань:

· Дослідження тематичного складу цільової колекції документів - наприклад, новинного потоку за вибраний інтервал часу. Виявлення ключових тем і їх зв'язкових скупчень (семантичних полів), що знаходяться у фокусі уваги і впливають на розвиток ситуації. Моніторинг динаміки інформаційного потоку в часі в термінах потужності ключових тем та їх зв'язків.

· Пошук нової, несподіваної інформації, пов'язаної з досліджуваним об'єктом-темою. Інтерес для експерта можуть представляти приховані в документах зв'язку з іншими об'єктами (персонами, організаціями, подіями), виявлені в семантичної мережі, а також асоціативні ланцюжки, що зв'язують задані об'єкти.

· Виявлення в документах підкріплень відомих і невідомих зв'язків між об'єктами-темами. Пошук конкретних документів, які розкривають цікавлять зв'язку, дозволяє експерту отримати детальне уявлення про характер відносин між об'єктами.


Пошукові системи


Пошукова система це комп'ютерна система, призначена для пошуку інформації.

Поява пошукових систем:

Найперший пошуковий інструмент в Інтернеті називався Archie. Він був створений в 1990 Аланом Емтаджем, студентом Монреальського Університету ім. Мак Гілла. Програма скачував списки файлів, розташовані на публічних анонімних FTP сайтах, створюючи бази даних імен файлів, за якими можна було виробляти поіск.індексіровал комп'ютерні файли, а Gopher - текстові документи. Gopher був створений Марком Мак Кахілла в Університеті Міннесоти. Будучи текстовими файлами, більшість сайтів Gopher згодом стали сторінками Павутини.

Дві інші програми, такі як Veronica і Jughead, шукали файли, збережені в пошуковому індексі Gopher. У Veronica можна було здійснювати пошук за ключовим словом серед назв документів, перелічених у Gopher. Jughead дозволяв отримувати інформаційне меню з різних серверів Gopher.

У 1993 студент МІТ Метью Грей винайшов першого робота, який індексував сторінки Інтернет - World Wide Web Wanderer. Спочатку програма дозволяла перераховувати веб - сервера, вимірюючи масштаби Павутини. World Wide Web Wanderer запускали щомісячно з 1993 по 1995 роки. Пізніше його використовували для отримання URL при формуванні першої бази даних Веба - Wandex.

Спочатку роботи створювали якесь незручність для серверів, оскільки вони вимагали багато мережевих ресурсів, і деколи сервери не витримували навантаження. Новітні роботи не знижують пропускної здатності сервера і використовуються для побудови індексів пошукових машин.

У 1993 Мартін Костер створив ALIWEB. ALIWEB дозволяв власникам сайтів подавати заявки на індексацію в пошукових машинах. На думку Костера, ALIWEB була пошуковою системою, заснованої на автоматизованому зборі мета-даних для Мережі.

У 1993 році студенти Стенфорда представили Excite. Програма використовувала статистичний аналіз слів у тексті, щоб полегшити процес пошуку. Протягом одного року Excite був досить вдосконалений, і вийшов онлайн в грудні 1995 року. На даний момент він є частиною компанії AskJeeves.

Мережа Galaxy виникла в 1994 році як частина пошукового консорціуму...


Назад | сторінка 3 з 8 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розробка алгоритму роботи синтаксичного аналізатора тексту, а також бази да ...
  • Реферат на тему: Методи пошуку інформації в мережі інтернет. Інформаційно-пошукові системи ...
  • Реферат на тему: Розвиток системи World Wide Web у функціонуванні мережі Інтернет
  • Реферат на тему: Проект мережі зв'язку з рухомими об'єктами
  • Реферат на тему: Значення системи World Wide Web у функціонуванні мережі Інтернет