Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Методи статистичного аналізу тексту

Реферат Методи статистичного аналізу тексту





Вілліс, 1922 р.) та ін

Найважливішим для розглянутої проблеми є той факт, що і документи всередині якої-небудь галузі знань можуть розподілятися відповідно до цього закону. Окремим випадком його є закон Бредфорда, безпосередньо пов'язаний вже не з розподілом слів у тексті, а з розподілом документів всередині якої-небудь тематичної області. p align="justify"> Англійський хімік і бібліограф С. Бредфорд, досліджуючи статті з прикладної геофізики і мастилі, зауважив, що розподілу наукових журналів, що містять статті з мастилі, і журналів, що містять статті з прикладної геофізики, мають загальний вигляд. На підставі встановленого факту С. Бредфорд сформулював закономірність розподілу публікацій з виданням. p align="justify"> Основний сенс закономірності полягає в наступному: якщо наукові журнали розташувати в порядку убування кількості статей з конкретного питання, то журнали в отриманому списку можна розбити на три зони таким чином, щоб кількість статей у кожній зоні по заданому предмету було однаковим. При цьому в першу зону, так звану зону ядра, входять профільні журнали, безпосередньо присвячені розглянутій тематиці. Кількість профільних журналів в зоні ядра невелика. Другу зону утворюють журнали, частково присвячені заданій області, причому число їх істотно зростає в порівнянні з числом журналів в ядрі. Третя зона, найбільша за кількістю видань, об'єднує журнали, тематика яких досить далека від розглянутого предмета. p align="justify"> Таким чином, при рівному числі публікацій з певної тематики в кожній зоні число найменувань журналів різко зростає при переході від однієї зони до іншої. С. Бредфорд встановив, що кількість журналів в третій зоні буде приблизно в стільки разів більше, ніж у другій зоні, у скільки разів число найменувань у другій зоні більше, ніж у першій. Якщо позначити р1 як число журналів в 1-й зоні, р2 - у 2-й, р3 - число журналів в 3-й зоні. Якщо a - відношення кількості журналів 2-ї зони до числа журналів 1-ї зони, то закономірність, розкрита С. Бредфордом, може бути записана так:

: P2: P3 = 1: a: a2

або: P2 = P2: P1 = a.


Цю залежність називають законом Бредфорда.

Б. Вікері уточнив модель С. Бредфорда. Він з'ясував, що журнали, проранжувати (збудовані) у порядку зменшення в них статей з конкретного питання, можна розбити не так на три зони, а на будь-яке потрібне число зон. Якщо періодичні видання розташувати в порядку зменшення в них кількості статей з конкретного питання, то в отриманому списку можна виділити ряд зон, кожна з яких містить однакову кількість статей. Приймемо наступні позначення х - кількість статей в кожній зоні. ТX - кількість журналів, що містять х статей, Т2x - кількість журналів, що містять 2х статей, тобто сума найменувань журналів в 1-й і в 2-й зонах, Т3x - кількість журналів, що містять 3х статей, тобто сума найменувань журналів в 1-й, 2-й і в 3...


Назад | сторінка 6 з 15 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Реферування журналів
  • Реферат на тему: Спеціфіка чоловічіх журналів
  • Реферат на тему: Критерії популярності глянцевих журналів
  • Реферат на тему: Тіпологічні Особливостігри масових журналів
  • Реферат на тему: Тіпологічні Особливості масових журналів