Міністерство освіти науки Російської Федерації
Федеральне агентство з освіти
ФГАОУ ВПО В«Уральський федеральний університет імені першого Президента Росії Б. М. ЄльцинаВ»
Інститут освітніх інформаційних технологій
Секція інформатизації бібліотечної справи
Спеціальність В«Бібліотечно-інформаційна діяльністьВ»
Реферат на тему
методів статистичного аналізу ТЕКСТУ
з дисципліни В«Аналітика текстуВ»
Виконав: Щеглова А., гр. ІТ-47021
Викладач: Гришина С. М.
Єкатеринбург
Зміст
Введення
. Частотний аналіз
. Ранжування даних
. Закон Бредфорда - Ціпфа0
. Контент-аналіз
.1 Визначення контент-аналізу
.2 Історія появи контент-аналізу
.3 Процедура контент-аналізу
.4 Види контент-аналізу
.5 Застосування контент-аналізу
Висновок
Список використаної літератури
Введення
У традиційній літературі текст досліджується в основному в рамках лінгвістики, герменевтики, семіотики, культурології і є одним з основних понять культури ХІХ-ХХ ст. В основному текст розглядається як галузь філології, літературознавча дисципліна, що вивчає твори писемності з метою встановлення їх особливої вЂ‹вЂ‹організації, відношення між текстом і культурним контекстом, як система висловлювань, володіють єдиним сенсом і як форма передача інформації. p align="justify"> Нерідко текст розглядають як дискурсивне єдність, тобто специфічний спосіб і правила організації мовленнєвої діяльності, незалежно письмовій або усній, що володіє різноманітною смисловою структурою, що породжує нові смисли і т.д. p align="justify"> Але можна підійти до тексту принципово з іншої сторони. І тоді текст, перш за все, розглядатиметься як формально-логічне утворення, яке можна досліджувати деякими формалізованими методами. Методологічною основою такого дослідження буде виступати статистичний принцип частотного розподілу ознаки (ознак), які у взаємозв'язку утворюють нові смисли. p align="justify"> Саме такий підхід організований в методах статистичного аналізу тексту - частотному аналізі, ранжируванні даних, законі Бредфорда-Ціпфа, контент-аналізі.
Мета даного реферату: охарактеризувати основні методи статистичного аналізу тексту.
1. Частотний аналіз
Частотний аналіз - це один з методів криптоаналізу, що грунтується на припущенні про існування нетривіального статистичного розподілу окремих символів і їх послідовностей як у відкритому тексті, так і зашифрованом...