dex за запитом
"Відкрита освіта"
Ви можете ознайомитися з роботою пошукових покажчиків за наступними адресами: altavista.com, lycos.com, google.ru, yandex.ru, aport.ru та інших .
Робіт ПУ відбувається в чотири етапи:
1. Сканування веб-простору . Пошукова система цілодобово за допомогою спеціальних програм переглядає доступне простір Web і копіює до себе всі зустрінуті сторінки. Сканування здійснюється за допомогою спеціальних програмних засобів. Їх загальна назва - пошукові роботи (ще - черв'яки, гусениці, краулери). Кожен пошуковий покажчик має свою власну програму, засновану на патентованому алгоритмі. Але загальний принцип дії один:
- пошукові роботи починають перегляд Мережі з якогось заданого адреси
- копіюють знайдений документ на сервер своєї системи
поглядають його, знаходять у ньому всі гіперпосилання
переходять по них, знаходять нові документи, копіюють їх, знаходять у них гіперпосилання. переходять по них і т.д.
періодично роботи повертаються до раніше переглянутих документів, щоб відстежити зміни. Про зміни вони дізнаються за розміром і датою створення документа. p align="justify"> 2. Індексація ресурсів. Виявлені пошуковими роботами сторінки обробляються спеціальними програмними засобами і з них складається спеціальна база даних, іменована покажчиком. Мета індексації - отримати індексний файл, за допомогою якого запит клієнта обробляється майже миттєво. Кожна система проводить індексацію за своїми алгоритмами, які є комерційною таємницею.
3. Пошук за запитом. Пошуковий покажчик приймає запит від користувача у вигляді ключових слів і відбирає посилання на ті ресурси, які відповідають запиту. Висока швидкість пошуку забезпечується за рахунок перших двох етапів своєї роботи, завдяки яким пошукова машина при обробці запиту користувача звертається не в Мережу, а до своєї бази даних. Кількість знайдених сторінок може бути дуже велике, тому перед видачею результатів клієнтові відбувається ранжирування результатів пошуку . Тобто система визначать цінність кожного із знайдених ресурсів і відсортовує їх так, щоб найбільш цінні розташовувалися на початку списку. Для цього кожному ресурсу дається оцінка. На підвищення оцінки впливають наступні факти:
- якщо ключові слова зустрічаються в заголовку Web сторінки - це значить, що сторінка дійсно присвячена тій темі, яку досліджує клієнт
- якщо ключові слова, виявлені в документі, мають шрифт збільшеного розміру - це говорить про те, що вони входять в заголовки розділів документів
якщо ключові слова неодноразово повторюються всередині документа (особливо, якщо в перших 5-8 абзацах тексту)
якщо ключові слова входять в так званий альтернативний текст (тот. який підміняє ілюстрації, якщо їх зображення вимкнено). Це означає, що користувач надає їм особливого значення. p align="justify"> 4. Формування результуючої сторінки. Система формує динамічну web-сторінку оформлених результатів пошуку. Приклад результуючої сторінки систем Google наведений на малюнку 3.
Основи роботи в пошукових покажчиках
Прийоми простого пошуку
1. Пошук групи слів.
Слова "відкрите" або "освіта" дадуть при пошуку поодинці велике число різноманітних посилань, що відносяться до зовсім різних тем, причому навряд чи мають відношення до "відкритого освіти". Тому рекомендується додавати одну або два ключових слова, пов'язаних з необхідною темою. Наприклад, "відкрита освіта" або "технології відкритої освіти". Необхідно також звужувати область питання. Якщо необхідно знайти інформацію про автомобілі марки Ford, то запит "автомобіль Ford" видасть більш відповідні документи, ніж "легкові автомобілі". Кількість слів в групі не обмежується. p align="justify"> 2. Пошук словоформ.
У більшості випадків пошукова система за замовчуванням шукає все словоформи мови. Однак, можна вказати пошуковій системі не перебирати всі словоформи слів із запиту при пошуку. br/>В
Рис. 3. Сторінка результатів пошуку в системі Google за запитом
"Віртуальний університет"
Зіставлення пошукових ...