даними відносяться відомості, витягнуті з документів, як первинних, так і вторинних і одержувані безпосередньо з джерел їх виникнення.
Розрізняють два види:
· Документально-фактографічний, полягає в пошуку в документах фрагментів тексту, що містять факти.
· Фактологічний (опис фактів), що передбачає створення нових фактографічних описів в процесі пошуку шляхом логічного переробки знайденої фактографічної інформації.
Наступні методи є більш приватними способами організації пошуку.
Булевой пошук - це комбінація елементів, що дозволяють включати і виключати з пошукових результатів документи, що містять певні слова. Це досягається за допомогою булевих операторів and, not, or, near.
Булевой пошук являє собою одну з найпростіших пошукових програм порівняння. Яскравим прикладом булевого пошуку служить використання будь-якої великої пошукової системи (Google, Yahoo) з безліччю слів. Це передбачає використання оператора And для пошуку всіх елементів. Наприклад, при введенні запиту семантичний інформаційний пошук, пошуку підлягають всі слова, відповідні запиту. Всі сторінки, де є слова: семантичний, інформаційний та пошук, будуть представлені в результатах.
Інший приклад. Якщо користувач хоче виключити з пошуку один з елементів, наприклад, інформаційний пошук - семантичний, пошуковий алгоритм сприйме це наступним чином: всі релевантні результати, що мають слова: інформаційний та пошук, будуть включені в результати пошуку, а от сторінки, на яких є слово семантичний , будуть виключені.
Дуже рідко пошукова система не підтримує булевий пошук. В основному, булеві оператори представлені у всіх системах і функціонують автоматично.
Багато сучасних пошукові системи світу підтримують пошук з використанням Wildcard-символів. Найчастіше Wildcard-символи у вигляді астеріска (*) або знака запитання (?) Використовуються для заміни букв при написанні.
Пошук з використанням Wildcard-символів припускає пошук елементів, які підходять словами з пропущеної буквою, наприклад, слова text або test можна шукати наступним чином: за допомогою te * t або te? t.
Останнім розглянь пошук побудований на застосуванні принципів семантики. Семантичний пошук - це процес пошуку документів за їх смисловому змісту.
Головні необхідні умови для його машинної реалізації - це переклад змісту документів і запитів з природної людської мови на інформаційно-пошукова мова, зрозумілий машині, і складання на його базі пошукових образів документа і, в кінцевому підсумку, точного запиту і складання пошукового опису, в якому вказується додаткова умова.
Принципова різниця між адресним (повсюдно використовуваним сьогодні) і семантичним пошуками полягає в тому, що при адресному пошуку документ розглядається як об'єкт з точки зору форми, а при семантичному пошуку - з точки зору змісту. Це означає, що при адресному пошуку ми маємо деякий екстракт документа (наприклад індекс), що зберігається в базі, разом з точною адресою на цей документ. І оперувати при такому пошуку ми можемо в будь-якому випадку тільки цими спеціально підготовленими екстрактами. При істинному змістовному пошуку (семантичному пошуку) ми оперуємо усім вмістом документа для визначення його ...