Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Методи статистичного аналізу тексту

Реферат Методи статистичного аналізу тексту





льшої відповідності шуканого запит [9]. p align="justify"> Далі ми будемо розглядати метод ранжирування даних в рамках пошукової системи, тому необхідно дати коротке визначення пошуковій системі.

Пошукова система - це веб-сайт, що надає можливість пошуку інформації в Інтернеті. Більшість пошукових систем шукають інформацію на просторах глобальної мережі, але існують також системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet. p align="justify"> Загальна схема ранжирування сайту виглядає приблизно так: по певному запиту пошуковик знаходить всі вхідні слова запиту на веб-сторінку. Далі враховуються такі чинники:

компактність ключових слів (розташування один від одного),

важливість (наявність ключових слів, а також близькість слів до початку сторінки),

порядок розташування, форма і т.д. p align="justify"> Виходячи з усіх цих параметрів призначається загальна вага (який інакше може найменувати як позиція) сторінки в результатах пошуку.

Завдяки різним дослідженням були визначені загальні методи ранжирування, які підходять для всіх пошукових машин. p align="justify"> Цитата

Пошукова машина вважає, що ті сторінки Інтернету, в яких слова запиту йдуть поруч, у тому ж порядку і в тій же формі як у запиті, більш релевантні (від англ. relevant - стосовно до результатів роботи пошукової системи та експертної системи - ступінь відповідності запиту і знайденого, тобто доречність результату), ніж інші сторінки, на яких ключові слова розсипані в довільному порядку або мають іншу граматичну форму.

Іншими словами, варто використовувати в тексті сторінки точні формулювання (цитати) пошукових запитів, і тоді будь-який сайт почне займати верхні рядки. p align="justify"> При цьому слід дотримуватися і точну форму слів, використовувати в тих же відмінках і числах, як і в запиті, який є основною метою. Це дасть значну перевагу, ранжування такої сторінки підвищиться в кілька разів. p align="justify"> Вага ключових слів запиту

Значно впливає також наявність ключових слів в самому тексті сторінки і та сторінка, на якій вага ключових слів буде вище, і яка, отже, буде оцінюватися пошукачами як найбільш релевантна.

Але частота вживання ключових слів повинна триматися в певних рамках, текст повинен виглядати якомога природно. Та сторінка, на якій ключове слово має вагу 50%, буде визнаний неприродним, пошукові машини візьмуть таку оптимізацію за пошукової спам і відповідно це зведе всі зусилля до нуля. p align="justify"> Близькість ключових слів до початку сторінки

Як правило, найбільш цінна і важлива інформація розміщується на початку сторінки, і якщо слова запиту знаходяться на сторінці ближче до початку, дана сторінка ранжируватиметься краще. p align="justi...


Назад | сторінка 4 з 15 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Розпізнавання ключових слів у потоці мовлення за допомогою фонетичного стен ...
  • Реферат на тему: Інтернет-сторінки товарів білоруських виробників
  • Реферат на тему: Створення web-сторінки
  • Реферат на тему: Розробка оффлайн-браузера, здатного зберігати HTML-сторінки з усім їх вміст ...
  • Реферат на тему: Стилістична оцінка порядку слів у реченні. Групи архаїзмів