по предмету Х, якщо термін Х не відбитий при індексуванні документа. Разом з тим є, однак, і різні способи зменшення повноти індексування (і відповідного підвищення точності) при пошуку. Найбільш очевидним з них є використання вагових коефіцієнтів.
2.3 Невдачі, обумовлені недосконалістю процесу пошуку
Існують три основні типи невдач, що відносяться до самого процесу пошуку:
1. явні помилки включають використання невідповідних термінів або неправильної стратегії пошуку;
2. невдачі, обумовлені прийнятими в пошуковій стратегії рівнями специфічності та / або повноти;
. втрати, обумовлені тим фактом, що особа, яка здійснює пошук, не використало всіх «розумних» способів для відшукання релевантних документів.
Невдача, пов'язана з не використанням всіх розумних способів для відшукання релевантних документів, часто є основною причиною втрат. До цієї причини слід віднести будь-який пропущений релевантний документ, який міг би бути знайдений по термінам або комбінаціям термінів, якщо виробляє пошук врахував би «розумні» можливості вибору термінів при складанні пошукового розпорядження. На практиці зустрічаються два види невдач цього типу:
1. пропуск одного релевантного терміна або комбінації термінів у формулюванні запиту, яка у всіх інших відносинах добре відображає інтереси споживача;
2. пропуск цілого аспекту запиту в тому вигляді, як він сформульований споживачем.
Перший тип менш небезпечний за своїми наслідками, ніж другий, але і він може істотно зменшити коефіцієнт повноти пошуку. Нехай, наприклад, шукається матеріал з лікування (тобто відновленню) ампутованих кінчиків пальців. Особа, що здійснює пошук, не використало жодного терміна, що відноситься до поняття «Лікування», цілком покладаючись лише на терміни, що відносяться до понять «Пальці» і «Ампутація». Однак не всі документи по пошкодженим кінчиків пальців заіндексувати терміном «Ампутація» (який використовується скоріше в сенсі терапевтичної, ніж травматичної ампутації), і повнота пошуку буде тому дуже низькою. Або розглянемо пошук матеріалів з ембріології кришталика ока. Особа, що здійснює пошук, координує термін «Кришталик ока» з термінами, що відносяться до ембріології, але не повністю відображає останню групу термінів (наприклад, терміни «Ембріон» і «Курячий ембріон» пропущені). У цьому випадку повнота пошуку також знижується.
Більш згубні наслідки можливі в разі пропуску особою, що здійснює пошук, цілих аспектів теми, експліцитно виражених в запиті. Цей тип невдач особливо часто зустрічається в досить довгих багатоаспектних формулюваннях запитів. Основною причиною його, мабуть, є недбале читання запиту.
У той час як пропуски потрібних термінів у пошуковому приписі призводять до втрат, використання невідповідних термінів викликатиме шуми. Розглянемо, наприклад, пошук матеріалів по машинному розпізнаванню клітин. Особа, що здійснює пошук, координує терміни, що відносяться до «Обробці даних», з термінами, що відображають поняття «Клітка», але помилково включає в першу групу термін «Кібернетика». Цей термін не має відношення до пошуку по темі «Розпізнавання клітин», яке по суті є окремим випадком проблеми розпізнавання образів, тому така помилкова координація п...