Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Семантичні мережі. Системи аналізу тексту і синтезу мови

Реферат Семантичні мережі. Системи аналізу тексту і синтезу мови





- потрапляння інформації в індекс пошукової системи.

Перший і другий процеси протікають безупинно і, найчастіше, одночасно. Постійно поповнюється база адрес сторінок і база інформації з цих сторінок.

До речі, в процесі індексації пошукові системи оцінюють якість сторінок, і інформація деяких з них не потрапляє в індекс. Пошуковик знає про їх існування, але з якихось причин вважає їх марними для користувача, тому не додає у видачу.

Етап 3. Визначення релевантності та ранжування

Якщо те, що ми обговорили в попередніх пунктах, працює безперервно і незалежно від зовнішніх факторів (дій людини), то третій етап в алгоритмі роботи пошукових систем починає діяти тільки під впливом людини.

Коли в пошуковику задається запит, система починає шукати на нього відповідь в наповненій базі знань за критеріями, заданими людиною в цьому запиті.

Спочатку, система робить вибірку, визначаючи все релевантні запиту сторінки з відомих. Наприклад, для запиту «купити холодильник Норд» релевантними будуть сторінки містять слова «купити», «холодильник», «Норд». Всі сторінки, що містять одне або декілька з цих слів, потраплять у видачу пошукової системи.

Наступне завдання пошукача, визначити в якій послідовності користувач побачить всі ці сторінки - їх необхідно ранжувати. Факторів, які будуть впливати на порядок видачі багато, за словами керівників Яндекс, їх понад 700. Цифра значна і розкрити їх усі не представляється можливим. Більше того, всі ці фактори невідомі жодному Сеошніку, оскільки пошуковики тримають їх у таємниці. Але в загальних рисах ці фактори можна розділити на три групи.

. Внутрішні чинники

До цієї групи відносяться фактори, на які здатний вплинути сам вебмастер. У їх число входить сам текст, розміщений на сторінці, його оформлення (абзаци, заголовки і інша розмітка). До них же відносяться картинки всередині тексту і оформлення самого сайту. Посилання, які розміщуються всередині сайту на різні сторінки (внутрішня перелінковка) також відносяться до внутрішніх чинників.

. Зовнішні фактори

В цілому, ця група факторів визначає популярність конкретного сайту на думку інших ресурсів інтернету. Визначається ця популярність кількістю і якістю сайтів, на яких проставлені посилання на різні сторінки вашого сайту, а також згадки про нього в тексті. Пошукові системи оцінюють цю авторитетність за складною схемою, що враховує дуже велика кількість факторів.

. Поведінкові чинники

Поведінка користувачів в інтернеті пошукові системи вміли відслідковувати не завжди. популярність ця група чинників почала набирати порівняно недавно. Різні лічильники статистики та спеціальні бари в браузерах збирають масу інформації про поведінку людей на сайтах. За цими даними Яндекс і Google визначають ступінь значущості сайтів для живих людей. Якщо на сторінках вашого сайту надовго затримуються відвідувачі, уважно читають якісні статті, переходять по внутрішнім посиланнях і роблять різні інші речі, значить він людям подобається і гідний розміщення на більш високих позиціях пошукової видачі.

На даний момент найпопулярніші пошукові системи в світі:

Пошукова сістемаДоля ринку в жовтні 2014Google lt; https: //ru.wikipedia/wiki/Google_Searchgt; 58.01% Baidu lt; https: //ru.wikipedia/wiki/Baidugt; 29.06 % Bing lt; https: //ru.wikipedia/wiki/Binggt; 8.01% Yahoo! lt; https: //ru.wikipedia/wiki/Yahoo! gt; 4.01% AOL lt; https: //ru.wikipedia/wiki/AOLgt; 0.21% Excite lt; https: //ru.wikipedia. org/wiki/Excite gt; 0,00% Ask lt; https: //ru.wikipedia/wiki/Askgt; 0,10%

Масштаб сучасних пошукових систем:

Число користувачів Інтернету і пошукових систем і вимог користувачів до цих систем постійно зростає. Для збільшень швидкості пошуку потрібної інформації, великі пошукові системи містять велику кількість серверів. Сервера зазвичай групують в серверні центри (дата центри). У популярних пошукових систем серверні центри розкидані по всьому світу.

У жовтні 2012 року Google запустила проект «Де живе Інтернет», де користувачам надається можливість познайомитися з центрами обробки даних цієї компанії.

Про роботу дата - центрів пошуковій системі Google відомо наступне:

· Сумарна потужність всіх дата - центрів Googlе станом на 2011 рік оцінювалася в 220 МВт.

· Коли в 2008 році Google планувала відкрити в Орегоні новий комплекс, що складається з трьох будівель загальною площею 6500000 кв.м. У журналі Harper s Magazine підрахували, що такий великий комплекс споживає понад 100 МВт електроенергії, що порівнянно з...


Назад | сторінка 5 з 8 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Пошук в інтернеті: пошукові системи Яндекс і Google
  • Реферат на тему: Методи пошуку інформації в мережі інтернет. Інформаційно-пошукові системи ...
  • Реферат на тему: Пошукові системи та індексація сторінок
  • Реферат на тему: Пошукові системи Інтернету
  • Реферат на тему: Довідково-пошукові системи мережі Інтернет