- потрапляння інформації в індекс пошукової системи.
Перший і другий процеси протікають безупинно і, найчастіше, одночасно. Постійно поповнюється база адрес сторінок і база інформації з цих сторінок.
До речі, в процесі індексації пошукові системи оцінюють якість сторінок, і інформація деяких з них не потрапляє в індекс. Пошуковик знає про їх існування, але з якихось причин вважає їх марними для користувача, тому не додає у видачу.
Етап 3. Визначення релевантності та ранжування
Якщо те, що ми обговорили в попередніх пунктах, працює безперервно і незалежно від зовнішніх факторів (дій людини), то третій етап в алгоритмі роботи пошукових систем починає діяти тільки під впливом людини.
Коли в пошуковику задається запит, система починає шукати на нього відповідь в наповненій базі знань за критеріями, заданими людиною в цьому запиті.
Спочатку, система робить вибірку, визначаючи все релевантні запиту сторінки з відомих. Наприклад, для запиту «купити холодильник Норд» релевантними будуть сторінки містять слова «купити», «холодильник», «Норд». Всі сторінки, що містять одне або декілька з цих слів, потраплять у видачу пошукової системи.
Наступне завдання пошукача, визначити в якій послідовності користувач побачить всі ці сторінки - їх необхідно ранжувати. Факторів, які будуть впливати на порядок видачі багато, за словами керівників Яндекс, їх понад 700. Цифра значна і розкрити їх усі не представляється можливим. Більше того, всі ці фактори невідомі жодному Сеошніку, оскільки пошуковики тримають їх у таємниці. Але в загальних рисах ці фактори можна розділити на три групи.
. Внутрішні чинники
До цієї групи відносяться фактори, на які здатний вплинути сам вебмастер. У їх число входить сам текст, розміщений на сторінці, його оформлення (абзаци, заголовки і інша розмітка). До них же відносяться картинки всередині тексту і оформлення самого сайту. Посилання, які розміщуються всередині сайту на різні сторінки (внутрішня перелінковка) також відносяться до внутрішніх чинників.
. Зовнішні фактори
В цілому, ця група факторів визначає популярність конкретного сайту на думку інших ресурсів інтернету. Визначається ця популярність кількістю і якістю сайтів, на яких проставлені посилання на різні сторінки вашого сайту, а також згадки про нього в тексті. Пошукові системи оцінюють цю авторитетність за складною схемою, що враховує дуже велика кількість факторів.
. Поведінкові чинники
Поведінка користувачів в інтернеті пошукові системи вміли відслідковувати не завжди. популярність ця група чинників почала набирати порівняно недавно. Різні лічильники статистики та спеціальні бари в браузерах збирають масу інформації про поведінку людей на сайтах. За цими даними Яндекс і Google визначають ступінь значущості сайтів для живих людей. Якщо на сторінках вашого сайту надовго затримуються відвідувачі, уважно читають якісні статті, переходять по внутрішнім посиланнях і роблять різні інші речі, значить він людям подобається і гідний розміщення на більш високих позиціях пошукової видачі.
На даний момент найпопулярніші пошукові системи в світі:
Пошукова сістемаДоля ринку в жовтні 2014Google lt; https: //ru.wikipedia/wiki/Google_Searchgt; 58.01% Baidu lt; https: //ru.wikipedia/wiki/Baidugt; 29.06 % Bing lt; https: //ru.wikipedia/wiki/Binggt; 8.01% Yahoo! lt; https: //ru.wikipedia/wiki/Yahoo! gt; 4.01% AOL lt; https: //ru.wikipedia/wiki/AOLgt; 0.21% Excite lt; https: //ru.wikipedia. org/wiki/Excite gt; 0,00% Ask lt; https: //ru.wikipedia/wiki/Askgt; 0,10%
Масштаб сучасних пошукових систем:
Число користувачів Інтернету і пошукових систем і вимог користувачів до цих систем постійно зростає. Для збільшень швидкості пошуку потрібної інформації, великі пошукові системи містять велику кількість серверів. Сервера зазвичай групують в серверні центри (дата центри). У популярних пошукових систем серверні центри розкидані по всьому світу.
У жовтні 2012 року Google запустила проект «Де живе Інтернет», де користувачам надається можливість познайомитися з центрами обробки даних цієї компанії.
Про роботу дата - центрів пошуковій системі Google відомо наступне:
· Сумарна потужність всіх дата - центрів Googlе станом на 2011 рік оцінювалася в 220 МВт.
· Коли в 2008 році Google планувала відкрити в Орегоні новий комплекс, що складається з трьох будівель загальною площею 6500000 кв.м. У журналі Harper s Magazine підрахували, що такий великий комплекс споживає понад 100 МВт електроенергії, що порівнянно з...