Порівняльний огляд пошукових систем З розвитком Інтернету в світі, на перше місце вийшла проблема пошуку інформації в мережі. Цю нішу відразу спробували зайняти кілька різних великих фірм, таких як Altavista, Lycos, AOL. Природно, що кожна з них розробила свої власні методи для знаходження інформації. Це і ручний метод в каталогах, і метод автоматичного пошуку сайтів в Інтернет, та індексації їх за допомогою спеціально розроблених для цього "spider"-ів. Їх метою було, починаючи з декількох великих web-вузлів, за наявними на них посиланнях, групам новин, проіндексувати весь інтернет. Але оскільки, чекати поки такої спайдер добереться до вашого сайту, доводилося дуже довго, було прийнято рішення про ручному додаванні сторонніми web-майстрами до бази спайдера посилань, слідуючи за якими спайдер міг швидко проіндексувати ресурс. p align="justify"> Майже аналогічно почалося поява подібних систем в СНД. До них можна, наприклад, віднести Russian Express, Rambler, Aport і Yandex - так як вони теж використовують спайдеров для пошуку нових сайтів. Однією з відмінностей пошукових систем СНД можна вважати те, що вони індексують тільки сайти СНД, або перевіряють кодування (мова) тексту - як Aport. Ось витяг з FAQ Yandex:
Яndex ранжує документи за обчислюваному параметру "релевантність". Релевантність документа залежить не тільки від числа слів запиту, знайдених в документі, але і від частотних характеристик шуканих слів, ваги слова або виразу, близькості шуканих слів у тексті документа один до одного і т.д.
Заголовки типу "type_Document_Title_here", або "Web Page Title Here", або "Insert Page Title Here", або "Put_Your_Title_Here", або "ТемаВ» не прикрашають ні сторінку, ні її Web-майстра. Крім цього, багато пошукові системи, у тому числі і Yandex, звертають особливу увагу на слова, що містяться в заголовку. Не варто брати перші 10 найбільш пошукових слів з якого-небудь Top100 і вписувати їх в заголовки, коментарі, і просто в текст білим по білому. По-перше, це не додає слави творцеві і викликає природне роздратування користувачів. По-друге, пошукові системи, і Яndex теж, починають з цим боротися. Крім цього, спам збільшує розмір документа і, отже, зменшує контрастність слів у ньому. p align="justify"> Але до речі, спаму уникати теж необхідно. Більше 30 разів повторене слово на першій сторінці, істотно знизить релевантність сторінки в цілому. І ще, російські пошукові системи не підтримують мета теги, тому створюючи web-сторінку російською мовою, подбайте про те, щоб у title і знаходилися релевантні фрази, а так само щоб вони були присутні вгорі тексту [2]. br/>
3.1 Історія створення пошукової системи GOOGLE
У 1995 р. двоє студентів докторантури Стенфордського університету - Ларрі Пейдж (Larry Page) і Сергій Брін - займалися різними аспектами управління даними. Саме Пейдж в далекому 1996 почав активно...