Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Оцінка і аналіз ефективності роботи інформаційно-пошукових систем

Реферат Оцінка і аналіз ефективності роботи інформаційно-пошукових систем





а. Очевидно, що повнота пошуку за вказівником буде вкрай низькою: документ не буде видаватися у відповідь на запит про предмет, дещо менш важливому, ніж головний предмет обговорення. Разом з тим щоразу, коли документ буде знайдений при пошуку в покажчику, він виявиться релевантним, так як в ньому мова значною мірою повинна йти про предмет запиту. Крім того, при індексуванні з низькою повнотою (лише окремі ключові слова) абсолютно виключається можливість появи помилкових координації на рівні понять і суттєво зменшується можливість таких координацій на рівні термінів.

Необхідно підкреслити, що рівень повноти при індексуванні визначається рішенням, прийнятою керівництвом пошукової системи. Це рішення не Завіт від властивостей мови індексування, якщо використовувана мова підходить для обробки тематичних областей, які розглядаються під вводяться документах, і якщо будь обговорюваний предмет може бути виражений у термінах мови системи, хоча б на більш загальному, родовому рівні.

Специфічність мови індексування

У той час як повнота системи визнаделяется швидше прийнятої повнотою індексування, ніж внутрішніми властивостями мови індексування, точність пошуку цілком залежить від здатності мови індексування точно описати обговорювані теми (тобто від його специфічності). Це твердження найкраще можна проілюструвати на прикладі. Розглянемо три різні пошукові системи А, В і С, в яких використовуються контрольовані словники, що містять відповідно 2000, 1000 і 500 термінів. Припустимо, що в кожній з цих систем заіндексувати той же самий масив документів з аеродинаміки. У деяких з цих документів йдеться про «тонких дельтовидних крилах».

При індексуванні таких документів в системі А, що має 2000 термінів, можна точно відобразити їх тематичний зміст за допомогою класу, озаглавленого «Тонкі дельтовидні крила». При індексуванні цих же документів в системі В з 1000 індексаційних термінів не можна точно відобразити їх зміст. Можливо, їх потрібно віднести до більш широкого класу під рубрикою «Дельтоподібні крила». Що ж стосується системи С то в ній, можливо, самим специфічним терміном, який може бути приписаний цьому класу документів виявиться термін «Крила».

При надходженні в систему А запиту по «Тонким дельтовидним крилам» можна точно виразити цей предмет при формулюванні пошукового розпорядження так само, як і при індексуванні документів, і можна очікувати, що в під масиві виданих документів буде багато релевантних документів (тобто коефіцієнт точності пошуку буде високим). З іншого


боку, коефіцієнт повноти пошуку буде, ймовірно, низьким, тому що система може не видати низку документів, які містять корисну інформацію з теми «Тонкі дельтовидні крила. Чи не будуть видані, наприклад:

. Документи, в яких йде мова про дельтовидних крилах взагалі, але міститься суттєва інформація по тонких дельтовидним крилам. Вони могли бути заіндексувати терміном «Дельтоподібні крила».

. Документи, в яких йде мова про тонких дельтовидних крилах, але заіндексувати синонімічні термінами або комбінацією термінів, наприклад «Дельтоподібні крила малого подовження».

Якщо той же запит направити в систему В, повнота пошуку збільшиться. У цьому випадку ми вже не можемо точно ...


Назад | сторінка 10 з 37 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Принципи індексування документів в мережі Інтернет
  • Реферат на тему: Підбір нормативно-технічних документів за вказівниками стандартів і за допо ...
  • Реферат на тему: Бланки документів, протоколи, експертиза цінності документів
  • Реферат на тему: Розробка і застосування класифікаційних довідників в діловодстві (номенклат ...
  • Реферат на тему: Види наукових документів, оцінка економічної ефективності теми