ентації по системі не описано, але бачимо, що ранжування застосовується як при простому пошуку, так і при розширеному запиті. Реально цю систему можна віднести до системи з розширеним булевим пошуком. b>
2.5 Yahoo
Дана система з'явилася в Мережі однією з перших, і сьогодні Yahoo співпрацює зі багатьма виробниками засобів інформаційного пошуку, а на різних її серверах використовується різне програмне забезпечення. Мова Yahoo досить простий: всі слова слід вводити через пробіл, вони з'єднуються зв'язкою AND або OR. При видачі не вказується ступінь відповідності документа запиту, а тільки підкреслюються слова із запиту, які зустрілися в документі. При цьому не виробляється нормалізація лексики і не проводиться аналіз на В«загальніВ» слова. Хороші результати пошуку виходять тільки тоді, коли користувач знає, що в базі даних Yahoo інформація є напевно. Ранжування виробляється за кількістю термінів запиту в документі. Yahoo відноситься до класу простих традиційних систем з обмеженими можливостями пошуку. br/>
2.6 OpenText
Інформаційна система OpenText являє собою самий комерціалізувати інформаційний продукт в Мережі. Всі описи більше схожі на рекламу, ніж на інформативне посібник з роботи. Система дозволяє провести пошук з використанням логічних конекторів, однак розмір запиту обмежений трьома термінами або фразами. У даному випадку мова йде про розширеному пошуку. При видачі результатів повідомляється ступінь відповідності документа запиту і розмір документа. Система дозволяє також поліпшити результати пошуку в стилі традиційного булевого пошуку. OpenText можна було б віднести до розряду традиційних інформаційно-пошукових систем, якби не механізм ранжування. br/>
2.7 Infoseek .
У цій системі індекс створює робот, але він індексує не весь сайт, а тільки зазначену сторінку. При цьому робот має такі пріоритети:
В· слова в заголовку
мають найвищий пріоритет;
В· слова в тезі keywords, description і частота входжень повторень у самому тексті;
В· при повторенні однакових слів поруч викидає з індексу
В· Допускає до 1024 символів для тега keywords, 200 символів для тега description;
В· Якщо теги не використовувалися, індексує перші 200 слів на сторінці і використовує як опис;
Система Infoseek має досить розвиненим інформаційно-пошуковим мовою, що дозволяє не просто вказувати, які терміни повинні зустрічатися в документах, а й своєрідно зважувати їх. Досягається це за допомогою спеціальних знаків "+" - Термін зобов'язаний бути в документі, і "-" - термін повинен відсутнім в документі. Крім цього, Infoseek дозволяє проводити те, що називається контекстним пошуком. Це означає, що використовуючи спеціальну форму запиту, можна зажадати послідовної спільної зустрічальності слів. Також можна вказати, що деякі слова повинні спільно зустрічатися не тільки в одному документі, а навіть в окремому параграфі або заголовку. Мається можливість вказівки ключових фраз, що становлять єдине ціле, аж до порядку слів. Ранжування при видачі здійснюється за кількістю термінів запиту в документі, за кількістю фраз запиту за вирахуванням загальних слів. Всі ці фактори використовуються як вкладені процедури. Підводячи коротке резюме, можна сказати, що Infoseek відноситься до традиційних систем з елементом зважування термінів при пошуку. b>
3. Пошукові роботи
За останні роки Всесвітня павутина стала настільки популярною, що зараз Інтернет є одним з основних засобів публікації інформації. Коли розмір Мережі виріс із декількох серверів і невеликого числа документів до величезних меж, стало ясно, що ручна навігація по значній частині структури гіпертекстових посилань більше не представляється можливою, не кажучи вже про ефективний метод дослідження ресурсів. p> Ця проблема спонукала дослідників Інтернет на проведення експериментів з автоматизованою навігацією по Мережі, названій "роботами". Веб-робот - це програма, яка переміщається по гіпертекстової структурі Мережі, запитує документ і рекурсивно повертає всі документи, на які даний документ посилається. Ці програми також іноді називають "павуками", "мандруєте", або "черв'яками" і ці назви, можливо більш привабливі, однак, можуть ввести в оману, оскільки термін "павук" і "Мандрівник" Cоздан хибне уявлення, що робот сам переміщається, а термін "хробак" міг би мати на увазі, що робот ще і розмножується подібно інтернетівському вірусу-черв'якові. Насправді, роботи реалізовані як проста програмна система, яка запитує інформацію з віддалених ділянок Інтернет, використовуючи стандартні Мережеві протоколи.
В
4. Найбільш популярні російськомовні довідково-пошукові системи в інтернет
4.1 Rambler
Пошукова система Рамблер почала своє існування з 1996 року. На ...