ustify"> Невдачі при пошуку, зумовлені недоліками мови індексування, бувають двох основних типів: 1
) невдачі, які є наслідком недостатньої специфічності термінів мови індексування, і 2) невдачі за рахунок неоднозначній або помилковою зв'язку термінів. Недостатня специфічність мови індексування може призвести як до втрат, так і до шумів при пошуку. Якщо ми при віднесенні документа до конкретного класу не можемо точно визначити останній в термінах мови індексування, хоча і використовуємо словник входів, наслідком недостатньої специфічності словника будуть шуми, а втрати, зараховують до цієї причини, будуть відсутні. Результатом пропуску поняття, наявного в словнику входів, будуть як шуми, так і втрати.
Для прикладу розглянемо тему «Порушення зорового сприйняття». Припустимо, що ми не можемо однозначно визначити це поняття, але вирішили його заіндексувати, використовуючи комбінацію термінів «Зір» і «Ілюзію».
Уявімо собі тепер, що мається запит на документ з даної теми. Оскільки поняття присутній в словнику входів, нам відомо, яку комбінацію термінів необхідно використовувати в пошуковому приписі. Пошук супроводжуватиметься шумом, оскільки логічне твір класів «Зір» і «Ілюзії» «Зорові ілюзії» - ширше точного класу «Порушення зорового сприйняття». Однак втрат не буде, так як наявність даного поняття в словнику входів дає можливість зберігати незмінним результат його ідентифікації при індексуванні і дозволяє точно визначити конкретний характер цієї ідентифікації особі, що проводить пошук. Припустимо тепер, що ми не маємо точного терміна для поняття «Порушення зорового сприйняття» І не можемо відобразити його будь-якої комбінацією інших термінів, хоча документ з даної теми введений в систему. У цьому випадку можливі наступні результати:
1. Пропуск цього поняття индексатором. Ймовірно, що при індексуванні документа, в якому йдеться про порушення зорового сприйняття, причому дана тема не обов'язково є в ньому центральної, вона буде опущена индексатором, якщо ні в словнику входів, ні в словнику термінів індексування немає точного терміна для її відображення.
2. Чи не ідентичність результатів індексування. Одні індексатори можуть використовувати «Зір» і «Ілюзії», в той час як інші - іншу комбінацію термінів.
. Втрати в процесі подальшого пошуку з даної теми. Деякі з них будуть наслідком перепусток понять при індексуванні, інші - неідентичності результатів індексування (особа, яка здійснює пошук, не знає, до якої категорії був віднесений запитуваний предмет, і не охоплює всіх можливих комбінацій термінів, необхідних для досягнення високої повноти).
. Поява додаткових шумів при пошуку.
Оскільки особа, яка здійснює пошук, не знає результатів індексування даного поняття, воно буде змушене використовувати велике число альтернативних комбінацій термінів, частина яких призведе до видачі великого числа іррелевантние документів.
Зі сказаного вище можна зробити деякі висновки. Втрати, зумовлені недостатньою специфічністю термінів, означають, що тема пошуку або деякі з її аспектів не відображені навіть у словнику входів системи. Шуми, зумовлені нестачею специфічності, вказують на неадекватність обсягів индексируемого поняття і понять, що використовуються для його визначення в сл...