where.com). p> В· Система Bigfoot
(Www.bigfoot.com). p>
Пошук організацій розділ Жовті сторінки (Yellow pages) на пошукових системах спеціалізовані сервера
yellowpages.com - Для пошуку в США та інших країнах. p> Користувачам Internet вже добре відомі назви таких сервісів і інформаційних служб, як Lycos, AltaVista, Yahoo, OpenText, InfoSeek, а без послуг цих систем сьогодні практи тично не можна знайти що-небудь корисне в море інформаційних ресурсів Мережі. Але що собою являють ці сервіси зсередини, як вони влаштовані, чому результат пошуку в терабайтних масивах інформації здійснюється досить швидко і як влаштовано ранжування документів при видачі - усе це звичайно залишається за кадром. Проте без правильного планування стратегії пошуку, знайомства з основними положеннями теорії ІПС (інформаційно-пошукових систем), нараховує вже двадцятирічну історію, важко ефективно використовувати навіть такі скорострільні сервіси, як AltaVista або Lycos.
Інформаційно-пошукові системи з'явилися на світ досить давно. Теорії та практиці побудови таких систем присвячено безліч статей, основна маса яких припадає на кінець 70-х - початок 80-х років. Серед вітчизняних джерел слід виділити науково-технічний збірник "Науково-технічна інформація. Серія 2 ", який виходить до цих пір. Російською мовою видана так само і "біблія" з розробки ІПС - "Динамічні бібліотечно-інформаційні системи" Ж. Солтона [1], у якій розглянуті основні принципи побудови інформаційно-пошукових систем і моделювання процесів їх функціонування. Таким чином, не можна сказати, що з появою Internet і бурхливим входженням його в практику інформаційного забезпечення з'явилося щось принципово нове, чого не було раніше. Якщо бути точним, то ІПС в Internet - це визнання того, що ні ієрархічна модель Gopher, ні гіпертекстова модель World Wide Web ще не вирішують проблему пошуку інформації у великих обсягах різнорідних документів. І на сьогоднішній день немає іншого способу швидкого пошуку даних, окрім пошуку за ключовими словами. При використанні ієрархічної моделі Gopher доводиться досить довго бродити по дереву каталогів, поки не зустрінеш потрібну інформацію. Ці каталоги повинні кимось підтримуватися, і при цьому їх тематичне розбиття має збігатися з інформаційними потребами користувача. Враховуючи анархічність Internet і величезна кількість всіляких інтересів у користувачів Мережі, зрозуміло, що комусь може і не пощастити і в мережі не буде каталогу, що відображає конкретну предметну область. Саме з цієї причини для безлічі серверів Gopher, званого GopherSpace була розроблена інформаційно-пошукова програма Veronica (Very Easy Rodent-Oriented Net-wide Index of Computerized Archives). p> Аналогічний розвиток подій спостерігається і в World Wide Web. Власне ще в 1988 році у спеціальному випуску журналу "Communication of the ACM" [2] серед інших проблем розробки гіпертекстових систем та їх використання Франк халази назвав як першочергового завдання для наступного покоління систем цього типу назвав проблему організації пошуку інформації у великих гіпертекстових мережах. До цих пір багато ідеї, висловлені в тій статті, не знайшли ще своєї реалізації. Природно, що система, запропонована Бернерсом-Лі [3] і отримала таке широке поширення в Internet, повинна була зіткнутися з тими ж проблемами, що і її локальні попередники. Реальне підтвердження цьому було продемонстровано на другій конференції по World Wide Web восени 1994 року, на якій були представлені доповіді про розробку інформаційно-пошукових систем для Web, а система World Wide Web Worm, розроблена Олівером МакБрайном з Університету Колорадо, отримала приз як кращий навігаційне засіб. Слід також відзначити, що все-таки довге життя судилася аж ніяк не чудесним програмами талановитих одинаків, а засобів, що є результатом планового і послідовного руху наукових і виробничих колективів до поставленої мети. Рано чи пізно етап досліджень закінчується, і настає етап експлуатації систем, а це вже зовсім інший рід діяльності. Саме така доля очікувала два інших проекти, представлених на тій же конференції: Lycos, підтримуваний компанією Microsoft, і WebCrawler, що став власністю America On-line. p> Розробка нових інформаційних систем для Web не завершена. Причому як на стадії написання комерційних систем, так і на стадії досліджень. За минулі два роки знятий тільки верхній шар можливих рішень. Проте багато проблем, які ставить перед розробниками ІПС Internet, не вирішено й досі. Саме цією обставиною і викликана поява проектів типу AltaVista компанії Digital [4], головною метою якого є розробка програмних засобів інформаційного пошуку для Web і підбір архітектури для інформаційного сервера Web.
В
Архітектура сучасних ІПС для WWW
Перш ніж описати проблеми побудови інформаційно-пошукових систем Web та шляхи їх вирішення розглянемо типову схему такої системи. У різних публікаціях, присвячених конкретних систем, наприкла...