Міністерство сільського господарства Російської Федерації
Бузулукський гідромеліоративний технікум
Філія ФГБОУ ВПО Оренбурзький ГАУ
Курсова робота
З дисципліни: «Експлуатація інформаційних систем»
На тему: «Створення електронного тезауруса з дисципліни« Комп'ютерні мережі »
Виконав: студент 31 групи ІС:
Русяев С.С
Перевірив: Дурнев П.В
г. Бузулук, 2014 г
ВСТУП
В даний час у зв'язку зі зростанням обсягу інформації, необхідної для прийняття рішень, і можливостями, що надаються комп'ютерними технологіями, автоматизовані тезауруси стали широко використовуватися в різних сферах діяльності людини. Організація швидкого та ефективного пошуку інформації стає все більш не вирішуваної проблемою. Мета документального пошуку - знаходження і видача відповідних запиту користувача документів або їх описів.
Традиційно інформаційно-пошукові системи застосовуються для тематичного пошуку науково-технічної інформації у великих бібліотеках, науково-технічних центрах, архівах. Таким чином, сфера докладання для технологій інформаційно-пошукових систем представляється досить широкою. При автоматизації пошуку документальної інформації найважливішою є проблема формалізації змісту документа і запиту. При цьому пошук відбувається по всьому тексту документа або за його пошуковому образу, а в якості запиту найчастіше виступають окремі ключові слова або їх логічні комбінації. Саме на цій технології заснована дія інформаційно-пошукового тезауруса. Метою курсової роботи є розробка електронного тезауруса з дисципліни «Комп'ютерні мережі».
Основні етапи технології розробки:
. Попередня обробка текстів;
. Побудова безлічі бажаних дескрипторів (ключових понять предметної області) і концептів;
. Вибір мови програмування або конструктора;
. Вибір шаблону;
. Вибір типу тезауруса;
. Створення тезауруса.
1. ОСНОВИ РОЗРОБКИ тезаурус
1.1 Поняття тезаурусів
Теза? урус (від грец. ???????? - скарб), в загальному сенсі - спеціальна термінологія, більш суворо і предметно - словник, зібрання відомостей, корпус або звід, повномірними охоплюють поняття, визначення і терміни спеціальної галузі знань або сфери діяльності, що має сприяти правильної лексичної, корпоративної комунікації (розумінню в спілкуванні і взаємодії осіб, пов'язаних однією дисципліною або професією); у сучасній лінгвістиці - особливий різновид словників, в яких вказані семантичні відносини (синоніми, антоніми, пароніми, гіпоніми, Гіпероніми і т. п.) між лексичними одиницями. Тезауруси є одним з дієвих інструментів для опису окремих предметних областей.
) Тезаурус (від грец. thesuarus скарб, скарбниця ) -
словник, у якому максимально повно представлені всі слова мови з вичерпним переліком прикладів їх вживання в текстах;
) Ідеологічний словник, у якому показані семантичні відносини (родовидові, синонімічні та ін.) між лексичними одиницями.
Тезаурус у першому значенні в повному обсязі здійснимо лише для мертвих мов. Структурною основою для тезауруса в другому значенні зазвичай служить ієрархічна система понять, що забезпечує пошук від смислів до лексичним одиницям, тобто пошук слів, виходячи з поняття.
Тезаурус - бібліотека з набором словників синонімів, антонімів, споріднених слів і родовидових зв'язків, яка служить для розширення пошукового запиту, що дозволяє знаходити релевантні текстові фрагменти за смисловим близькості до запиту. Висока цінність Тезауруса полягає у великому обсязі словникової бази та правильному ранжируванні замін.
У широкому розумінні тезаурус позначає систему знань, якою володіє будь-якою суб'єкт або група суб'єктів, про дійсність. Суб'єкт також здатний приймати нову інформацію, за рахунок чого вихідний тезаурус буде змінюватися. У тезаурусе міститься не тільки інформація про дійсність, а й додаткова інформація, за рахунок якої з'являється можливість прийому нових відомостей. У 1970-х роках поширилися інформаційно-пошукові тезауруси. До їх складу входить лексична одиниця, звана дескриптором. Вона служить для пошуку інформації в автоматичному режимі. Кожному слову тезауруса зіставляється синонімічний дескриптор, для якого задаються семантичні віднос...