Інформаційно-пошукова система
Розглянемо постановку завдання пошуку в загальному вигляді. Для цього нам необхідно відповісти на три питання: що шукати, тобто, які джерела інформації, де шукати (місця розміщення цих джерел) і як шукати (які інструменти для цього використовувати).
В
Які основні джерела інформації, представлені в Інтернеті ?
Це документи WWW, статті в групах новин і списках розсилки, файли в бібліотеках файлів, довідники адресної інформації організацій і людей (електронна пошта, адреса, телефон), статті в тематичних базах даних, енциклопедіях.
Де ці джерела інформації розміщуються ?
Це такі популярні ресурси Інтернет, як WWW, групи новин, списки розсилки і FTP-сервери. Безумовно, можна шукати потрібні джерела інформації вручну, дізнаватися адреси з спеціалізованих журналів з інформатики та Інтернету, використовувати спеціальні паперові довідники з класифікованими за категоріями адресами. Однак для такого мінливого простору як Інтернет необхідно навчитися користуватися спеціальними інструментами, мета яких - збирати дані про інформаційних ресурсах та надавати користувачам послугу швидкого пошуку.
ІПС (Інформаційно-пошукова система) - це система, що забезпечує пошук і відбір необхідних даних у спеціальній базі з описами джерел інформації ( індексі ) на основі інформаційно-пошукової мови і відповідних правил пошуку.
Головним завданням будь ІПС є пошук інформації релевантної інформаційним потребам користувача. Дуже важливо в результаті проведеного пошуку нічого не втратити, тобто знайти всі документи, пов'язані з запитом, і не знайти нічого зайвого. Тому вводиться якісна характеристика процедури пошуку - релевантність.
Релевантність - це відповідність результатів пошуку сформульованому запитом. Далі ми будемо, в основному, розглядати ІПС для всесвітньої павутини (WWW). Основними показниками ІПС для WWW є просторовий масштаб і спеціалізація. За просторового масштабом ІПС можна розділити на локальні, глобальні, регіональні та спеціалізовані. Локальні пошукові системи можуть бути розроблені для швидкого пошуку сторінок в масштабі окремого сервера. Регіональні ІПС описують інформаційні ресурси певного регіону, наприклад, російськомовні сторінки в Інтернеті. Глобальні пошукові системи на відміну від локальних прагнуть осягнути неосяжне - По можливості найбільш повно описати ресурси всього інформаційного простору мережі Інтернет. p> У загальному випадку, можна виділити наступні пошукові інструменти для WWW: каталоги, пошукові системи, метапоіскових системи.
В
Каталог
В
Каталог - пошукова система з класифікованих за темами списком анотацій з посиланнями на web-ресурси. Класифікація, як правило, проводиться людьми. Пошук в каталозі дуже зручний і проводиться за допомогою послідовного уточнення тем. Тим не менш, каталоги підтримують можливість швидкого пошуку певної категорії або сторінки по ключовими словами за допомогою локальної пошукової машини. База даних посилань (Індекс) каталогу зазвичай має обмежений обсяг, заповнюється вручну персоналом каталогу. Деякі каталоги використовують автоматичне оновлення індексу. Результат пошуку в каталозі представляється у вигляді списку, що складається з короткого опису (анотації) документів з гіпертекстової посиланням на першоджерело.
Адреси популярних каталогів:
Зарубіжні каталоги:
Yahoo - yahoo.com Magellan - mckinley.com
Російські каталоги:
@ Rus - aport.ru Weblist - weblist.ru Равлик - ulitka.ru
В
Пошукова машина
В
Пошукова машина - пошукова система з формованої роботом базою даних, яка містить інформацію про інформаційні ресурси. Відмінною рисою пошукових машин є той факт, що база даних, що містить інформацію про Web-сторінках, статтях Usenet і т.д., формується програмою-роботом. Пошук в такій системі проводиться за запитом, що складається користувачем, складається з набору ключових слів або фрази, укладеної в лапки. Індекс формується і підтримується в актуальному стані роботами-індексіровщікамі. В описі документа найчастіше міститься кілька перших речень або витяги з тексту документа з виділенням ключових слів. Як правило, вказана дата оновлення (перевірки) документа, його розмір у кілобайтах, деякі системи визначають мову документа і його кодування (для російськомовних документів). Що можна робити з отриманими результатами? Якщо назва та опис документа відповідає вашим вимогам, можна негайно перейти до його першоджерела за посиланням. Це зручніше робити в новому вікні, щоб мати можливість далі аналізувати результати видачі. Багато пошукових систем дозволяють проводити пошук у знайдених документах, причому ви можете уточнити ваше запит введенням додаткових термінів. Якщо інтелектуальність сист...