безпекаВ».
. Перший крок: пошук текстів
На цьому кроці допустимо, що експерт вводить в рядок пошуку просто слово В«хробакВ». Природно, що він отримує вельми не задовільну вибірку з точки зору пертінентності. br/>В
рис. 3: Результати пошуку текстів
2. Другий крок: Побудова ДНФ
На основі знайдених текстів, експерт запускає процес побудови ДНФ.
У підсумку система видає йому наступний список евристик:
В§ Черв'як шкідливий файл
В§ Черв'як вірус файл
В§ Новина черв'як файл
В§ Черв'як вірус
В§ Черв'як файл
В§ Новина черв'як
В§ Файл
Як видно, за рахунок того, що вибірка релевантних текстів містила відносно невелику кількість текстів, в списку є зайві евристики (файл, новина, новина файл). Але, по-перше, експерт може видалити зайві евристики. А, по-друге, експертна система знайшла вже ті евристики, які, швидше за все, зможуть цілком задовольнити інформаційну потребу користувача (черв'як вірус файл, черв'як вірус, черв'як файл). p align="justify">. Перевірка отриманих результатів
Результати пошуку за отриманими евристикам:
В
рис. 4: Результати пошуку
Наскільки видно, вже зараз результати пошуку експертною системою набагато перевершують результати пошуку, отримані Яндексом.
При цьому слід відзначити той факт, що оскільки експертна система посилає кілька запитів пошуковій системі, то, як правило, кількість текстів, що задовольняють інформаційну потребу користувача в кілька разів більше, за рахунок того, що результати пошуку від різних евристик складаються.
5. Порівняння результатів пошуку з іншими пошуковими системами
Розглянемо порівняльну таблицю результатів пошуку з використанням різних пошукових систем з точки зору пертінентності:
РубрікаКолічество текстів у выборкеGoogleЯндексВиртуальный каталогВірус1070% 50% 100% Червь10100% Цифрова подпісь1080% 80% 100% Троянський конь1020% 20% 100% Вірус3030% 35% 100% Червь3050% 40% 100% Цифрова подпісь3075% 70 % 100% Троянський конь3020% 20% 100% Вірус5020% 25% 100% Червь5035% 30% 85% Цифрова подпісь5050% 50% 80% Троянський конь5010% 5% 100%
Оцінка являє собою процентне співвідношення кількості текстів відповідних тематиці від текстів невідповідних т...