мі слова. Взагалі кажучи, і всі три слова можуть бути пізнані як одна ключова фраза. Інший підхід полягає в обчисленні близькості між запитом і документом. У цьому випадку, відповідно до векторної моделлю подання документів і запитів обчислюється міра близькості. До теперішнього часу відомо близько дюжини різних заходів близькості. Найбільш часто застосовується cos кута між пошуковим образом документа і запитом користувача. Саме ці відсотки відповідності документа запиту і видаються в якості довідкової інформації при списку знайдених документів.
Найбільш просунутим мовою запитів є наступний: крім звичайного набору AND, OR, NOT, ця система дозволяє використовувати ще й NEAR. Останній оператор дозволяє організувати контекстний пошук. Всі документи в системі розбиті на поля, тому в запиті можна вказати в якій частині документа користувач хоче побачити ключове слово (на засланні, заголовку і т.п.). Можна також задати поле ранжирування видачі і критерій близькості документів запиту.
1.5 Дескриптор
Дескриптор (позднелат. descriptor, від лат. describо - описую) - лексична одиниця (слово, словосполучення) інформаційно-пошукової мови, що служить для опису основного смислового змісту документів. Дескриптори служать також для формулювання інформаційних запитів при пошуку документів в інформаційно - пошуковій системі
1.6 Критерій відповідності
Критерій відповідності - сукупність правил, за якими при інформаційному пошуку визначається ступінь відповідності пошукового образу документа пошуковому приписом і приймається рішення про видачу або невидачу цього документа у відповідь на інформаційний запит. Поряд з інформаційно-пошуковим мовою критерій відповідності є одним з елементів інформаційно-пошукової системи.
1.7 Індексування
інформаційний пошуковий система дескриптор
Індексування - процес вираження головного предмета або теми тексту якого-небудь документа в термінах інформаційно-пошукової мови. Застосовується для полегшення пошуку необхідного тексту серед безлічі інших. Проводиться Індексування (І) як цілого документа, так і його частини. Для І нерідко використовуються заголовки текстів. При І опускаються супутні предмети або теми. Це служить причиною того, що при пошуку невіднайденій залишаються тексти, для яких предмет або тема інформаційного запиту є не головною, а супутньою. Розрізняють 2 основних типи І. - класифікаційне і координатне. При класифікаційному І, або класифікуванні, тексти залежно від їх змісту включаються у відповідний клас (один або декілька), в якому збираються всі тексти, що мають в основному однакове смисловий зміст. Кожному такому тексту присвоюється індекс цього класу, службовець далі його пошуковим образом. При координатному І основне смисловий зміст тексту виражається переліком повнозначних слів, обираних небудь з самого тексту або його заголовка, або із спеціального нормативного словника. У першому випадку такі лексичні одиниці називаються ключовими словами, а в другому - дескрипторами. Кожне ключове слово або дескриптор позначає клас, в який потенційно входять всі тексти, де в вираження основного смислового змісту входить це слово. Логічне твір класів, які позначені всіма словами, що виражають в сукупності основне смисловий зміст тексту, як би утворює деякий складний клас. Побудований таким способом складний клас позначається переліком ключових слів або дескрипторів, і цей перелік служить пошуковим образом даного тексту або виразом на інформаційно - пошуковому мовою смислового змісту запиту. Таким чином, при координатному І смисловий зміст тексту виражається як би зазначенням його координат в деякому n-вимірному смисловому просторі. Різновидом координатного І є пермутаціонное, або циклічне, І, яке засноване на використанні ключових слів заголовка тексту і полягає в тому, що всі ключові слова заголовка разом з контекстом по черзі виводяться в пошукову колонку. У цій колонці ключові слова даються в алфавітному порядку. На основі координатного І створені і складніші інформаційно-пошукові мови. Основна перевага координатного І перед класифікаційним полягає в тому, що координатне І не створює ніяких труднощів при пошуку текстів по любому, заздалегідь не передбаченому поєднанню ознак. Особливим типом І слід вважати розкриття смислового змісту тексту через приводиться разом з ним бібліографію - імена авторів і бібліографічні описи їх робіт, на які посилається автор даного тексту. Таке І служить основою для складання покажчиків цитованої літератури - вельми ефективного інструменту не тільки для пошуку документів, а й для вирішення інших завдань (науковедчеських, прогностичних і т. Д.).
РОЗДІЛ ІІ. Сучасні інформаційно-пошукові системи Інтернету
2.1 Архітекту...