в якості гарною реалізації:
Переваги векторної моделі:
В· Схема, визначальна ваги термінів, підвищує продуктивність пошуку по відношенню до булевої моделі.
В· Стратегія часткового відповідності дозволяє знаходити документи, частково задовольняють умовам запиту.
В· Ранжірованние результати пошуку та контроль їх величини.
В· Гнучкість і інтуїтивна геометрична інтерпретація.
Недоліки векторної моделі:
В· Припущення про незалежність між термінами.
В· Неможливість використання структурованих запитів (немає операторів OR, AND, NOT).
В· Терміни є осями (навіть з використанням стеммінга може вийти більш 20000 вимірів).
3. Дослідження методів оцінки якості пошуку
інформаційний векторний matlab програма
Головною мірою якості пошуку є "щастя" користувача. Воно залежить від багатьох факторів:
В· Доцільності результатів.
В· Дизайну макета інтерфейсу користувача.
В· Швидкості відгуку.
В· Цільового програми:
o Веб-движок: користувач знаходить те, що хоче, і повертається до движку.
o Сайт продажу онлайн: користувач знаходить те, що хоче, і робить покупку.
o Сайти підприємств, компаній, держави, освіти: турбота про "продуктивності користувача" (як багато часу він зберігає, коли шукає інформацію).
Якість системи залежить від швидкості індексації, швидкості пошуку, величини колекції документів, використовуваної мови запитів, швидкість при використанні складних запитів. Щоб виміряти ефективність інформаційного пошуку, нам необхідні:
В· тестова колекція документів (повинна мати розумний розмір). Необхідно усереднювати продуктивність, так як результати сильно відрізняються в залежності від різних документів та інформаційних потреб.
В· тестовий набір інформаційних потреб, виражений через запити,
В· набір оцінок релевантності, зазвичай це двійкове позначення для кожної пари запит-документ, що показує релевантний ч...