Чому потрібен новий алгоритм?
«У міру того, як ведуться Війни пошуковик між Google, MSN і Yahoo, ми не тільки станемо свідками все змітають змін алгоритмів, але також і нових вимірів в технологіях і взаємодіях з Пошукової машиною».
У той час, як алгоритм PR (page rank) непогано справлявся всі ці роки, все ж у системі PR існує істотний недолік, і Google знав про це. Система PR визначає абсолютну «ступінь цінності» web-сторінки, грунтуючись на кількості і якості сайтів, що посилаються на неї.
Тим не менше, «PR цінність" не специфічна для пошукових термінів і тому, високий PR сторінки, що містить згадування off-топіковой ключової фрази, часто забезпечував високу ранжування за цією фразою. Krishna Bharat з Каліфорнії усвідомлюючи недолік цієї, що грунтується на PR, ранжир системі, виступив в 1999-2000 рр.. з алгоритмом, який назвав «Hilltop». Він оформив патент Hilltop в січні 2001р. у співавторстві з Google. Немає потреби говорити про те, що Google зрозумів гідності, придбані з цим новим алгоритмом для своєї системи ранжування, приєднавши його до собсвенно системі PR.
Hilltop міг чудово заповнити наявний пробіл. Алгоритм Hilltop перед даними застосуванням, можливо, зазнав декількох очисткам.
Що ж таке алгоритм Hilltop?
Ось, вам просте пояснення:
За своєю суттю, PR визначає «авторитетність» web-сторінки в загальному. Hilltop (він же LocalScore -" місцевий рахунок") визначає «авторитетність» web-сторінки по відношенню до даного запиту або пошуковому терміну. ??
Bharat формулює, що замість використання просто «PR цінності» для знаходження «авторитетних» web-сторінок, важливішим буде, якщо «цінність» володіє тематичної релевантностью. Виходячи з цього, більш корисно підраховувати посилання від «тематично релевантних» документів на дану сторінку. Він називав ці «тематично релевантні» документи «експертними документами», а посилання від таких експертних документів на цільові документи визначали як «показник авторитетності» останніх.
Алгоритм Hilltop обчислює «показник авторитетності» web-сторінок (занадто спрощено висловлюючись) наступним чином:
Запустіть звичайний пошук за ключовою фразою для визначення експертних документів. Визначальні правила для «експертних документів» жорсткі, тому «тіло» - це цілком певне, піддається управлінню кількість web-сторінок.
Відфільтруйте «дочірні» (Affiliate *) сайти і cкопіруйте сайти зі списку експертних.
Сторінки визначені за місцевим показником (LocalScore) «авторитетності», заснованому на кількості і якості голосів, одержуваних від експертних документів. Потім сторінки ранжуються відповідно до їх LocalScore.
Як Hilltop визначає дочірні (affiliate) сайти?
* Affiliate-сайти визначаються таким чином:
Сторінки, що походять з того ж самого домену ((ibm, ibm/us/, products.ibm, solutions.ibm і т.д;
Сторінки, що походять з тих же доменів, але різних рівнів і вторинних суфіксів (наприклад ibm, ibm.co.uk, ibm.co.jp і т.д.);
Сторінки, що відбуваються з сусідніх IP (перші 3 загальні вісім цифр з номера IP, наприклад: 66.165.238.xxx - загальні);
Сторінки, що походять з самих дочірніх сайтів (якщо abc хостірован на тому ж самому cокете IP, що і ibm, тоді abc є дочірнім по відношенню до ibm.co.uk навіть, якщо вони на різних IP адресах).
Необхідно зауважити, що алгоритм Hilltop будує свої підрахунки...