мі, яка містить тексти на природній мові, ми маємо масив планів вираження джерел на природній мові, а на вході інформаційної системи ми маємо безліч запитів у вигляді планів вираження, сформульованих споживачами інформації.
Для того щоб вирішити завдання пошуку необхідної споживачеві інформації, необхідно змоделювати (уявити) - про який фрагменті предметної області споживач хоче отримати інформацію. Далі необхідно переглянути зберігаються документи - плани вираження, складені джерелами, представити (змоделювати), що хотів сказати джерело про предметну область, і на основі науково обгрунтованої методики відібрати ті з документів, які відповідають на поставлене запитання повністю або частково. p align="justify"> Роботи в галузі машинного перекладу і теорії побудови документальних інформаційних систем, що проводяться протягом останніх 50 років у нашій країні і за кордоном, показали, що процес виявлення сенсу довільного тексту природною 'мовою не підлягає автоматизації і може бути реалізований лише людиною, що володіє глибокими знаннями в даній предметній області.
Проте суспільство потребувало побудові документальних інформаційних систем, в першу чергу в галузі науково-технічної інформації. Для того щоб полегшити пошук у великих масивах текстової інформації, стали будувати інформаційно-пошукові системи, в яких документи описувалися за допомогою спеціальних пошукових мов. За допомогою елементів цих же мов відписувалися і запити. Для відбору документів у відповідь на запит здійснювалося порівняння пошукових образів запитів та пошукових образів документів, яке проводилося на одному і тому ж штучною мовою. Такий підхід є вимушеним. p align="justify"> Через недоліки природної мови, зазначених вище, документальні інформаційні системи не дають відповіді на питання споживача, а видають йому документи, в яких може міститися відповідь на його запит, надаючи споживачу самому виявити смисловий зміст цих документів . Питання оцінки ефективності пошуку інформації в документальних інформаційних системах будуть розглянуті нижче. br/>
. Питання ефективності пошуку інформації в Інтернеті та професійних базах
Одними з найбільш важливих показників ефективності інформаційних систем, що містять текстову інформацію, є семантичні показники. Семантичні показники засновані на оцінці релевантністю між документами і запитами. p align="justify"> Релевантність - об'єктивно існуюче смислове відповідність між змістом документа і запиту. Об'єктивність оцінок релевантністю забезпечується тим, що вони встановлюються експертним шляхом, а не автором запиту. p align="justify"> Пертінентност' - це суб'єктивно оцінювана відповідність змісту документів або текстів інформаційним інтересам споживача. Пертінентность може оцінити тільки автор запиту, який працює з інформаційною системою. Оцінки пертінеітності, як правило, відрізняються від результатів, отриманих ...