Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые проекты » Автоматизовані інформаційно - пошукові системи

Реферат Автоматизовані інформаційно - пошукові системи





нтролювати відбуваються там зміни і виявляти В«мертвіВ» посилання, тобто втратили актуальність.

Після копіювання розшуканих Web-ресурсів на сервер пошукової системи починається другий етап роботи - індексація. У ході індексації створюються спеціальні бази даних, за допомогою яких можна встановити, де і коли в Інтернеті зустрічалося, те чи інше слово. Вважайте, що індексована база даних - це свого роду словник. Вона необхідна для того, щоб пошукова система могла дуже швидко відповідати на запити користувачів. Сучасні системи здатні видавати відповіді за частки секунди, але якщо не підготувати індекси заздалегідь, то обробка одного запиту буде тривати годинами.

На третьому етапі відбувається обробка запиту клієнта і видача йому результатів пошуку у вигляді списку гіперпосилань. Припустимо, клієнт хоче дізнатися, де в Інтернеті є Web-сторінки, на яких згадується відомий голландський механік, оптик і математик Християн Гюйгенс. Він вводить слово Гюйгенс в поле набору ключових слів і натискає кнопку. Знайти (Search). По своїх базах покажчиків пошукова система в частки секунди розшукує підходящі Web-ресурси і формує сторінку результатів пошуку, на якій рекомендації представлені у вигляді гіперпосилань. Далі клієнт може користуватися цими посиланнями для переходу до цікавлять його ресурсів.

Все це виглядає досить просто, але на самому справі тут є проблеми. Основна проблема сучасного Інтернету пов'язана з достатком Web-сторінок. Досить ввести в поле пошуку таке просте слово, як, наприклад, футбол, і російська пошукова система видасть кілька тисяч посилань, згрупувавши їх за 10-20 штук на відображуваної сторінці. p> Кілька тисяч - це ще не так багато, тому що зарубіжна Пошукова система в аналогічній ситуації видала б сотні тисяч посилань. Спробуйте знайти серед них потрібну! Втім, для рядового споживача абсолютно все одно, видадуть йому тисячу результатів пошуку або мільйон. Як правило, клі-енти переглядають не більше 50 заслань, що стоять першими, і що там робиться далі, мало кого турбує. Однак клієнтів дуже і дуже турбує якість самих перших заслань. Клієнти не люблять, коли в першому десятку зустрічаються посилання, втратили актуальність, їх дратує, коли поспіль йдуть посилання на сусідні файли одного і того ж сервера. Самий же поганий варіант - коли поспіль йдуть кілька посилань, що ведуть до одного і того ж ресурсу, але що знаходиться на різних серверах.

Клієнт має право очікувати, що найпершими будуть стояти найбільш корисні посилання. Ось тут і виникає проблема. Чоло-століття легко відрізняє корисний ресурс від марного, але як пояснити це програмі?! Тому кращі пошукові системи проявляють чудеса штучного інтелекту в спробі відсортувати знайдені посилання по якісності їх ресурсів. І робити це вони повинні швидко - клієнт не любить чекати.

Строго кажучи, всі пошукові системи черпають вихідну інформацію з одного і того ж Web-простору, тому вихідні бази даних у них можуть бути відносно схожі. І лише на третьому етапі, при видачі результатів пошуку, кожна пошукова система починає проявляти свої кращі (або гірші) індивідуальні риси. Операція сортування отриманих результатів називається ранжируванням. Кожній знайденої Web-сторінці система привласнює якийсь рейтинг, який повинен відображати якість матеріалу. Але якість - поняття суб'єктивне, а програмі потрібні об'єктивні кри терії, які можна виразити числами, придатними для порівняння.

Високі рейтинги отримують Web-сторінки, у яких ключове слово, використане в, запиті, входить в заголовок. Рівень рейтингу підвищується, якщо це слово зустрічається на Web-сторінці кілька разів, але не дуже часто. Сприятливо впливає на рейтинг входження потрібного слова в перші 5-6 абзаців тексту - вони вважаються найважливішими при індексації. З цієї причини досвідчені Web-майстри уникають давати на початку своїх сторінок таблиці. Для пошукової системи кожна клітинка таблиці виглядає, як абзац, і тому змістовний основний текст як би далеко відсувається назад (хоча на екрані це і не помітно) і перестає грати вирішальну роль для пошукової системи.

Дуже добре, якщо ключові слова, використані у запиті, входять в альтернативний текст, супроводжуючий ілюстрації. Для пошукової системи це вірна ознака того, що дана сторінка точно відповідає запиту. Ще однією ознакою якості Web-сторінки є той факт, що на неї є посилання з якихось інших Web-сторінок. Чим їх більше, тим краще. Значить, ця Web-сторінка популярна і має високий показником цитування. Найдосконаліші пошукові системи стежать за рівнем цитування зареєстрованих ними Web-сторінок та враховують його при ранжируванні.

Творці Web-сторінок завжди зацікавлені в тому, щоб їх переглядало більше людей, тому вони спеціально готують сторінки так, щоб пошукові системи давали їм високий рейтинг. Хороша, грамотна робота Web-майстри здатна значно підняти відвідуваність Web-сторінки, однак є й такі В«майстриВ», як...


Назад | сторінка 5 з 8 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Пошукові системи та індексація сторінок
  • Реферат на тему: Методи пошуку інформації в мережі інтернет. Інформаційно-пошукові системи ...
  • Реферат на тему: Застосування пошукової системи &Rambler& для організації пошуку й системати ...
  • Реферат на тему: Пошук в інтернеті: пошукові системи Яндекс і Google
  • Реферат на тему: Пошукові системи Інтернету