ustify"> або ? = ВЅ
Коли значення двох чисел відрізняються, середнє гармонійне ближче до їх мінімуму, ніж середнє арифметичне або геометричне. Наприклад, якщо 1 з 10000 документів релевантний, ми можемо отримувати 100% повноти, витягуючи всі документи. Середнє арифметичне буде 50%, а гармонійне - 0,02%. p align="justify"> Повнота, точність і F-міра є заходами, заснованими на множинах (наприклад, невпорядкований набір документів). У ранжируваних пошукових системах значення P і R пов'язані з позицією в рейтингу. Оцінка проводиться шляхом обчислення точності, як функції від повноти. Якщо (k +1)-ий знайдений документ релевантний, то R (k +1)> R (k), а P (k +1)> P (k). Якщо (k +1)-ий знайдений документ нерелевантен, то R (k +1) = R (k), але P (k +1)
В
Одіннадцатіточечная інтерпольованого середня точність (11-point interpolated average precision). Вимірюється точність на 11 рівнях повноти {0.0, 0.1, 0.2, ..., 1.0}, потім розраховується середнє арифметичне рівня точності. p align="justify"> Щоб знайти середнє значення середньої точності (mean average precision (MAP)), обчислюється середня точність (AP) для кожного інформаційного запиту. Потім значення середньої точності виходить для набору з перших k документів, наявних після кожного знаходження релевантного документа. MAP = середнє значення AP безлічі інформаційних потреб. br/>
- запит?
- документи, релевантні запиту
- ранжований набір перших k знайдених результатів.
Для однієї інформаційної потреби AP пов'язана з площею під неінтерполірованной кривої точності/повноти. Приклад:
В
Розрахунок точності для k. Фіксується k - кількість видобутих результатів, наприклад k = 10. Обчислюється точність для перших k об'єктів. Гідність: не потрібен безлічі релевантних документів (корисно для веб-пошуку). Недолік: загальна кількість релевантних документів сильно впливає на точність для k. Наприклад, якщо кількість релевантних документів дорівнює 8, то точність для 20 буде не більше 0,4. p align="justify"> R-точність. Для відомого релевантного безлічі розміру Rel обчислюється кількість релевантних документів r серед перших Rel результатів пошуку. Гідність: ідеальна система досягає R-точність = 1,0. Недолік: розглядається тільки одна точка на кривій точність/повнота. p align="justify"> Операційна характеристика приймача (receiver operating characteristic). ROC-крива відображає графік залежності частки вірно позитивних класифікацій (чутливості) від частки хибн...