Пошук інформації в інтернет
В
Загальні відомості.
В даний час Інтернет об'єднує сотні мільйонів серверів, на яких розміщені мільярди різних сайтів і окремих файлів, що містять різного роду інформацію. Це гігантське сховище інформації. Існують різні прийоми пошуку інформації в Інтернет.
Пошук за відомою адресою. Необхідні адреси беруться з довідників. Знаючи адресу, досить ввести його в адресний рядок браузера.
Приклад 1.
gov.ru - сервер органів державної влади Росії.
Конструювання адреси користувачем. Знаючи систему формування адреси в Інтернет, можна при поіскеWeb-сайтів конструювати адреси.
До ключовим словом (назвою фірми, підприємства, організації або простому англійського іменника) необхідно додати домен тематичний або географічний, при цьому необхідно підключати інтуїцію.
Приклад 2.
Адреси комерційних Web-сторінок:
cnn.com (всесвітні новини CNN),
sony.com (фірма SONY),
mtv.com (музичні новини MTV). p> Приклад 3.
Адреси навчальних закладів:
ntu.edu (Національний університет США).
Приклад 4.
Адреси регіональних серверів:
poland.net (Польща),
israil.net (Ізраїль).
Пошукові системи Інтернет
Для пошуку інформації в Інтернет розроблені спеціальні інформаційно-пошукові системи. Пошукові системи мають звичайний адресу і відображаються у вигляді Web-сторінки, що містить спеціальні засоби для організації пошуку (рядок для пошуку, тематичний каталог, посилання). Для виклику пошукової системи досить ввести її адресу в адресний рядок браузера.
За способом організації інформації інформаційно-пошукові системи діляться на два види: класифікаційні (Рубрикатори) і словникові. p> рубрикатор (класифікатори) - пошукові системи, в яких використовується ієрархічна (деревоподібна) організація інформації. При пошуку інформації користувач переглядає тематичні рубрики, поступово звужуючи поле пошуку (наприклад, якщо необхідно знайти значення якогось слова, то спочатку в класифікаторі потрібно знайти словник, а потім вже в ньому знайти потрібне слово).
Словникові пошукові системи - це потужні автоматичні програмно-апаратні комплекси. З їх допомогою проглядається (сканується) інформація в Інтернет. У спеціальні довідники-індекси заносяться дані про місцезнаходження тієї чи іншої інформації. У відповідь на запит здійснюється пошук у відповідності зі рядком запиту. У результаті користувачеві пропонуються ті адреси (URL), на яких у момент сканування знайдені шукані слово або група слів. Вибравши будь-який з запропонованих адрес-посилань, можна перейти до знайденого документа. Більшість сучасних пошукових систем є змішаними.
Найбільш відомі і популярні системи пошуку:
aport.ru yahoo.com rambler.ru yandex.ru altavista.com google.com
Існують системи, спеціалізуються на пошуку інформаційних ресурсів за різними напрямками.
Пошук людей в Інтернет:
whowhere.ru ww. bigfoot.com
Пошук з телеконференцій (Usenet):
dejanews.com
Предметні пошукові системи:
webring.org
Пошук програмного забезпечення:
files.com
files.ru
Пошук по файлових архівів:
# "#"> рис.1), на якій ми зупинимося докладніше.
Уявіть себе на місці користувача, що вперше відвідав таку відому глобальну пошукову систему, як Lycos, з метою знайти в Мережі відомості про якийсь книжковому виданні. Ввівши відповідні ключові слова і вибравши фільтр Books, він отримує відгук, який, за відсутності додаткової інформації, не можна розцінити інакше, як отримання даних про книги, зібраних по всьому Інтернету. Цікаво було б задати питання, а чи може в масштабі Мережі автоматично вестися відбір подібних відомостей? Якщо говорити тільки про простір WWW, то в більшості випадків програми-павуки, скануючі Мережа, використовують для розпізнавання типу даних спеціальні елементи мови HTML, за допомогою яких в Web-сторінку впроваджуються певні інформаційні блоки. Назва елемента може нести смислове навантаження і ототожнюватися з типом інформації. Так, якби гіпотетично існував елемент HTML book, що містить в собі відомості про книгу і її автора, він міг би розміщуватися на сторінці і в простому випадку мати наступний вигляд:
Назва книги і автор
(самі елементи в вікні браузера не повинні відображатися) При цьому вся інформація про книги, публікує в WWW подібним чином, могла б благополучно і без участі людини накопичуватися в базі даних ІПС. Але елемента book в стандарті HTML поки не існує. Отже, доводиться вдаватися або до "ручного" відбору, або до автоматичного перегляду деяких, заданих наперед каталогів окремих вузлів, можливо, мають відношення до продажу книжкової продукції або до бібліотекам.
У разі Lycos все набагато простіше. Пошук відбувається всього-навсього по одному-єд...