Реферат Оцінка і аналіз ефективності роботи інформаційно-пошукових систем

Тема: Новые рефераты

- ної повноти для всієї групи запитів, отримуючи повне безліч релевантних документів у відповідь на кожен запит. Очевидно, що це значення повноти може бути досягнуто тільки при дуже низькому значенні точності, так як переважна більшість виданих документів буде нерелевантні для кожного запиту. Наприклад, якщо обсяг видачі складає 10 000 джерел і на кожен запит є в середньому 20 релевантних документів, то 100%-ва повнота, що виходить при видачі всіх релевантних документів у відповідь на кожен запит, досягається при значенні точності 0,2% або 20 / 10000 (точка А на фіг. 4).

З іншого боку, для кожного запиту можна так точно сформулювати стратегію пошуку (тобто скласти вичерпне припис з високим рівнем специфічності), що у відповідь на нього майже напевно будуть видаватися тільки релевантні документи, якщо документи взагалі будуть видаватися. Якщо в певній групі запитів використовувати тільки такі пошукові приписи високої точності, можна очікувати, що система буде функціонувати з точністю 100%, але з дуже низькою повнотою.

У реальних умовах, коли фонд документів був якось заіндексувати (щоб уникнути необхідності видачі всього безлічі документів у відповідь на кожний запит) і проводиться пошук для деякої групи запитів шляхом зіставлення пошукових приписів з пошуковими образами документів, не матиме місця жодна з наведених вище екстремальних значень. Замість цього для всієї групи запитів система функціонуватиме на якійсь точці кривої характеристик пошуку, відповідної значенням повноти і точності, меншим ніж 100%.

Якщо утворити узгоджену систему документів, запитів і суджень про ступеня релевантності документів запитам так, що ми будемо знати, які документи релевантні яких запитах, можна повторно заіндексувати весь масив документів по відношенню до цієї групи запитів. Після великого числа проб і помилок ми зможемо відшукати оптимальну систему індексування та оптимальний набір пошукових образів для даного масиву документів стосовно даного безлічі запитів. У результаті в пошукові образи документів і запитів будуть внесені такі індексаційні терміни, які дозволять домогтися функціонування системи з максимально високими характеристиками.

Іншими словами, є можливість створити такі описи документів, які забезпечують 95,90,85% або будь-який інший бажаний рівень повноти при максимально можливому рівні точності. Таким чином, на основі повного набору суджень про релевантності документів стосовно запитам можна створити замкнуту систему, здатну працювати на кривій максимально можливих характеристик.

Як було сказано раніше, для будь-якого фонду документів і певної групи запитів і суджень про релевантності мається крива характеристик системи з максимально можливими значеннями. Однак точно не відомо, як розташована ця крива. Реально діюча пошукова система не функціонує при максимально можливому рівні характеристик для будь-якої групи запитів. Цей рівень, може бути досягнутий тільки при індексуванні пост фактум наявного масиву документів з урахуванням набору пошукових приписів і суджень про ступінь релевантності. У повсякденній роботі пошукової системи, коли пошуки проводяться по реально існуючих запитам, крива залежності характеристик системи лежить десь лівіше і нижче кривої максимально можливих значень. По суті, ми при оцінці характеристик пош...

Назад | сторінка 15 з 37 | Наступна сторінка

Схожі реферати:

Реферат на тему: Бланки документів, протоколи, експертиза цінності документів

Реферат на тему: Структура команди мови запитів SQL. Простий запит. Багатотабличного запит

Реферат на тему: Розробка і застосування класифікаційних довідників в діловодстві (номенклат ...

Реферат на тему: Підбір нормативно-технічних документів за вказівниками стандартів і за допо ...

Реферат на тему: Інформаційно-аналітична система для оформлення відрядних документів

Український реферат переглянуто разів: | Коментарів до українського реферату:

Коментарів до українського реферату: 0