и проведенні повторних циклів пошуку, пошуку найбільш свіжої інформації або для аналізу тенденцій розвитку об'єкта дослідження в динаміці.
Іншою можливою причиною може з'явитися те, що більшість пошукових машин оновлює свої індекси зі значною затримкою, викликаної гігантськими обсягами оброблюваних даних, і ця затримка зазвичай тим більше, ніж менш популярна цікавить тема.
Це міркування може виявитися досить істотним при проведенні пошуку в вузькоспеціальної предметної області.
2. Пошукові системи
Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.
Основними критеріями якості роботи пошукової машини є релевантність (ступінь відповідності запиту і знайденого, тобто доречність результату), повнота бази, облік морфології мови.
Індексація інформації здійснюється спеціальними пошуковими роботами.
Останнім часом з'явився новий тип пошукових движків, заснованих на технології RSS, а також серед XML-даних різного типу.
Поліпшення пошуку - це одне з пріоритетних завдань сьогоднішнього Інтернету.
2.1 Використання пошукових систем на Заході
За даними компанії Net Applications в грудні 2007 року використання пошукових систем на Заході розподілялося таким чином:
Google - 77,04%
Yahoo - 12,46%
MSN - 3,33%
Microsoft Live Search - 2,57%
AOL - 2,12%
Ask - 1,38%
AltaVista - 0,13%
Excite - 0,07%
Lycos - 0,02%
All the Web - 0,02%
У вищенаведений звіт не входять російські пошуковики, такі як, наприклад, Яндекс, Рамблер або Nigma.
За даними аналітичної компанії comScore всі пошукові сайти в грудні 2007 року обробили 66 млрд 221 млн пошукових запитів.
Яндекс потрапив в статистику і знаходиться на 9-му місці.
2.2 Історія пошукових систем
Одним з перших інструментів пошуку в інтернеті (до WWW) був Archie.
Першої пошуковою системою для Всесвітньої павутини був В«WandexВ», вже не існуючий індекс, який створював В«World Wide Web WandererВ» - Бот, розроблений Метью Греєм (англ. Matthew Gray) з Массачусетського технологічного інституту в 1993.
Також в 1993 році з'явилася пошукова система В«AliwebВ», працююча досі.
Першої повнотекстової, тобто індексуються ресурси при допомогою робота, пошуковою системою стала В«WebCrawlerВ», запущена в 1994.
На відміну від своїх попередників, вона дозволяла користувачам шукати по будь ключовими словами на будь-який веб-сторінці - відтоді це стало стандартом у всіх основних пошукових системах.
Крім того, це був перший пошуковик, про який було відомо в широких колах.
У 1994 був запущений В«LycosВ», розроблений в університеті Карнегі Мелона. p> Незабаром з'явилася безліч інших конкуруючих пошукових машин, таких як В«ExciteВ», В«InfoseekВ», В«InktomiВ», В«Northern LightВ» і В«AltaVistaВ». p> У певному сенсі вони конкурували з популярними інтернет-каталогами, такими, як В«Yahoo!В».
Пізніше каталоги з'єдналися або додали до себе пошукові машини, щоб збільшити функціональність.
У 1996 році російськомовним користувачам інтернету стало доступно морфологічне розширення до пошукової машини Altavista і оригінальні російські пошукові машини Rambler і Aport.
23 вересня 1997 була відкрита пошукова машина Яндекс.
Останнім часом завойовує все більшу популярність практика застосування методів кластерного аналізу та метапоіска.
З міжнародних машин такого плану найбільшу популярність здобула В«ClustyВ» компанії VivГsimo.
У 2005 році на російських просторах за підтримки МДУ запущений пошуковик Nigma, що підтримує автоматичну кластеризацію.
У 2006 році відкрилася російська метамашіна Quintura, що пропонує візуальну кластеризацію у вигляді хмари ключових слів.
Nigma теж експериментувала з візуальною кластеризацією.
3. Російськомовні пошукові системи
Більшість В«російськомовнихВ» пошукових систем індексують і шукають тексти на багатьох мовах - українською, білоруською, англійською та ін
Відрізняються ж вони від В«всеязичнихВ» систем, індексуючих всі документи підряд, тим, що в основному індексують ресурси, розташовані в доменних зонах, де домінує російська мова або іншими способами обмежують своїх роботів російськомовними сайтами.
Яндекс (46,3% Рунета)
Mail.ru (8,9% Рунета)
Rambler (3,3% Рунета)
Nigma (0,5% Рунета)
Генон (0,1% Рунета)
Gogo.ru (<0,1% Рунета)
Aport (<0,1% Рунета)
З перерахованих рейтингів не всі мають власний пошуковий алгоритм - так QIP.ru використовують пошуковий механізм Яндекса, Mail.ru використовує Google, а Nigma поєднує в собі як сві...