Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Інформаційно-пошукова система

Реферат Інформаційно-пошукова система





ся користувачеві в його програму перегляду Web. Для того щоб швидко шукати записи інвертованого списку, над ним надбудовується ще декілька файлів, наприклад, файл буквених пар з зазначенням записів інвертованого списку, що починаються з цих пар. Крім цього, застосовується механізм прямого доступу до даних - хешування. Для оновлення індексу використовується комбінація двох підходів. Перший можна назвати корекцією індексу "на ходу" за допомогою таблиці модифікації сторінок. Суть такого рішення досить проста: стара запис індексу посилається на нову, яка і використовується при пошуку. Коли число таких посилань стає достатнім для того, щоб відчути це при пошуку, то відбувається повне оновлення індексу - його перезавантаження. Ефективність пошуку в кожній конкретній ІПС визначається виключно архітектурою індексу. Як правило, спосіб організації цих масивів є "секретом фірми" і її гордістю. Для того щоб переконатися в цьому, досить почитати матеріали OpenText [11]. br/>

Інформаційно-пошуковий мову системи

Індекс - це тільки частина пошукового апарату, прихована від користувача. Другою частиною цього апарату є інформаційно-пошукова мова (ІПМ), що дозволяє сформулювати запит до системи в простій і наочній формі. Вже давно залишилася позаду романтика створення ІПМ, як природної мови, - саме цей підхід використовувався в системі Wais на перших стадіях її реалізації. Якщо навіть користувачеві пропонується вводити запити на природній мові, то це ще не означає, що система здійснюватиме семантичний розбір запиту користувача. Проза життя полягає в тому, що зазвичай фраза розбивається на слова, з яких видаляються заборонені і загальні слова, іноді проводиться нормалізація лексики, а потім всі слова зв'язуються або логічним AND, або OR. Таким чином, запит типу:


> Software that is used on Unix Platform


буде перетворений в:

> Unix AND Platform AND Software


що означатиме приблизно наступне: "Знайди всі документи, в яких слова Unix, Platform і Software зустрічаються одночасно ". p> Можливі й варіанти. Так, в більшості систем фраза "Unix Platform" буде визначена як ключова фраза і не буде поділятися на окремі слова. Інший підхід полягає в обчисленні ступеня близькості між запитом і документом. Саме цей підхід використовується в Lycos. У цьому випадку відповідно до векторної моделлю подання документів і запитів обчислюється їх міра близькості. Сьогодні відомо близько дюжини різних мір близькості. Найбільш часто застосовується косинус кута між пошуковим чином документа і запитом користувача. Зазвичай ці відсотки відповідності документа запиту і видаються в якості довідкової інформації при списку знайдених документів.

Найбільш розвиненою мовою запитів з сучасних ІПС Internet володіє Alta Vista. Крім звичайного набору AND, OR, NOT ця система дозволяє використовувати ще й NEAR, що дозволяє організувати контекстний пошук. Всі документ в системі розбиті на поля, тому в запиті можна вказати, в якій частині документа користувач сподівається побачити ключове слово: посилання, назва, анотація тощо Можна також задавати поле ранжирування видачі і критерій близькості документів запиту.

В 

Інтерфейс системи


Важливим фактором є вид подання інформації в програмі-інтерфейсі. Розрізняють два типи інтерфейсних сторінок: сторінки запитів і сторінки результатів пошуку.

При складанні запиту до системі використовують або меню - орієнтований підхід, або командний рядок. Перший дозволяє ввести список термінів, зазвичай поділюваних пропуском, і вибрати тип логічного зв'язок між ними. Логічний зв'язок поширюється на всі терміни. На наведеній на рис. 1 схемі є збережені запити користувача - в більшості систем це просто фраза на ІПМ, яку можна розширити за рахунок додавання нових термінів і логічних операторів. Але це тільки один спосіб використання збережених запитів, званий розширенням або уточненням запиту. Для виконання цієї операції традиційна ІПС зберігає не запит як такий, а ре зультат пошуку - список ідентифікаторів документів, який об'єднується/перетинається зі списком, отриманим при пошуку документів за новими термінам. На жаль, збереження списку ідентифікаторів знайдених документів в WWW не практикується, що було викликано особливістю протоколів взаємодії програми-клієнта і сервера, що не підтримують сеансовий режим роботи.

Отже, результат пошуку в базі даних ІПС - це список покажчиків на задовольняють запиту документи. Різні системи представляють цей список по-різному. У деяких видається тільки список посилань, а в таких, як Lycos, Alta Vista і Yahoo, дається ще й короткий опис, яке запозичується або із заголовків, або з тіла самого документа. Крім цього, система повідомляє, на скільки знайдений документ відповідає запиту. В Yahoo, наприклад, це кількість термінів запиту, містяться в ПОД, відповідно до якого ранжирується результат пошуку. Система Lycos ...


Назад | сторінка 6 з 7 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Методи пошуку інформації в мережі інтернет. Інформаційно-пошукові системи ...
  • Реферат на тему: Розробка інформаційно-довідкової системи альтернативного пошуку квартир
  • Реферат на тему: Структура команди мови запитів SQL. Простий запит. Багатотабличного запит
  • Реферат на тему: Застосування пошукової системи &Rambler& для організації пошуку й системати ...
  • Реферат на тему: Система автоматизованого пошуку на таблицях