Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Оцінка і аналіз ефективності роботи інформаційно-пошукових систем

Реферат Оцінка і аналіз ефективності роботи інформаційно-пошукових систем





нкретного документа відповідно зменшується. Зрозуміло, це справедливо і для всіх інших заіндексувати документів. Індексування кожного документа з максимальною повнотою забезпечує максимальну повноту пошуку за вказівником.

Однак, якщо високий рівень повноти індексування забезпечує високу повноту пошуку, він одночасно знижує його точність. Це пов'язано в основному з двома причинами. По-перше, якщо в кожному вводимом документі виділяються і враховуються всі або принаймні істотна частина підлягають індексуванню предметів, то тим самим виявляються заіндексувати і багато предметів, які лише злегка зачіпаються в даному документі. Отже, і вони також будуть видаватися у відповідь на запити, по відношенню до яких вони містять дуже мало інформації.

Припустимо, що розглянутий раніше документ, що містить шість предметів, є звітом, що описує певні аеродинамічні явища, і в ньому йдеться про застосування конкретного математичного методу, скажімо методу Польхаузена для розрахунку одного з цих явищ. Припустимо також, що цей математичний метод був виділений на стадії понятійного аналізу індексування і виражений відповідними термінами мови індексування. Нехай цей метод буде предметом Р. По відношенню до запиту (можливо, дуже рідкісного), в якому споживач вимагає всю літературу, яка описує застосування методу Польхаузена, цей документ є релевантним і повинен бути виданий. Високий рівень повноти індексування виявиться корисним для даного запиту, що вимагає великої повноти видачі. Однак розглянемо запит (ймовірно, більш частий), у відповідь на який споживач хоче отримати документи, що описують сам метод Польхаузена і способи його застосування. Йому потрібні лише суттєві статті за цим методом; статті, в яких він тільки згадується, є для його запиту нерелевантними. Проте пошук в масиві документів з аеродинаміки, заіндексувати з високим рівнем повноти, може привести до видачі великого числа документів, в яких міститься лише просте згадування про даний метод. У цьому випадку високий рівень повноти індексування викличе видачу великої кількості небажаних джерел (тобто зменшить точність пошуку).

Друга причина зменшення точності пошуку при високому рівні повноти індексування укладаєте в наступному. Чим більше предметів враховано при індексуванні і чим більше термінів мови індексування використовується для вираження цих предметів, тим більша ймовірність виникнення помилкових координацій термінів при пошуку (припускаючи, що покажчик посткоордініруемий). Так, документ з [шістьма предметів ABCDEF, в якому, допустимо, А пов'язаний з В, С з D і Е з F, може бути помилково виданий у відповідь на будь-який з 12 двухаспектной запитів (А у зв'язку з С, А в зв'язку з D, В в зв'язку з С і т.д.). Якщо кожен з шести предметі виражений певним числом окремих незв'язаних термінів мови індексування, ймовірність появи помилкових координацій на рівні термінів надзвичайно зростає.

З урахуванням всього вище сказаного не зайве все ж ще раз підкреслити, що високий рівень повноти індексування призводить до великої повноті і низької точності пошуку. І навпаки, < i align="justify"> низький рівень повноти індексування викликає малу повноту і високу точність пошуку. Розглянемо ситуацію, в якій прийнята методика індексування з мінімальним рівнем повноти. Кожен документ в цьому випадку індексується лише з одного предмета - по головній темі документ...


Назад | сторінка 9 з 37 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Принципи індексування документів в мережі Інтернет
  • Реферат на тему: Психічні особливості прийняття образу тіла у схильних до повноти людей
  • Реферат на тему: Прямий пошук без обмежень. Метод пошуку Хука-Дживса для функції Розенброка ...
  • Реферат на тему: Чисельні методи пошуку стаціонарних точок у оптимізаційних задачах: метод Н ...
  • Реферат на тему: Застосування пошукової системи &Rambler& для організації пошуку й системати ...