Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Статистичний аналіз текстів різних авторів на основі їх морфологічних характеристик

Реферат Статистичний аналіз текстів різних авторів на основі їх морфологічних характеристик





ільманФ.С. ФіцджеральдОб'ем, символів № x ijk T ij / x ij x ijk T ij / x < i align="justify"> ij x ijk T ij / x ij 100127,869,7 / 23,2329 , 462,7 / 20,9046,288,7 / 29,57221,1 / 24,57228,620,021,1313,313,321,4200125,894,8 / 31,6019,456,8 / 18,9325,080,9/26,97232,5 / 25,83227,620,730,0341,416,725,9300124,5102,5 / 34,1730,267,4 / 22,4732,690,7 / 30,23260,6 / 28,96234,120,527 , 9343,916,730,2400135,593,3 / 31,1023,152,8 / 17,6040,473,1 / 24,37219,2 / 24,36220,315,922,2337,513,810,5500128,091,8 / 30 , 6018,358,8 / 19,6036,4101,2 / 33,73251,8 / 27,98240,320,827,5323,519,737,3 Сума за групами авторів T j / середнє за групами авторів x j 452,1 / 30,14298, 5/19, 90434,6 / 28,97 x =26,34

У таблиці скомбіновані всі дані, які можуть знадобитися при двухфакторную дисперсному аналізі. Процентний вміст іменників у текстах неоднаково. Це може бути обумовлено як впливом факторів А або В, так і випадковими відхиленнями. Метою дисперсного аналізу та є з'ясування відповіді на питання, від чого ж залежить кількість різних частин мови.

В двухфакторную дисперсному аналізі можна виділити 5 типів варіювання, так як визначається загальне відхилення, вплив окремо фактора А, окремо фактора В, спільне вплив факторів А і В, а також випадкові відхилення. Кожному з типів варіювання відповідає своя сума квадратів відхилень. Тому перший етап аналізу - обчислення суми квадратів.

Загальна сума квадратів обчислюється за формулою:



де x ijk - кожна варіанта;

x - середнє значення варіант за всіма даними.

Існує також значно спрощена робоча формула:



де T - сума T ij , рівна;

n - число варіант в кожній підгрупі (одно 3);

c - кількість груп по фактору В (одно 3);

r - кількість груп по фактору A (одно 5).

Для іменників загальна сума квадратів відхилень по першій:



або по другій формулі складе:



Сума квадратів відхилень для варіювання за фактором А:



де x i - середнє значення варіант в рядку.

Робоча формула буде мати вигляд:



де T i - сума варіант для i -рядів - за рівнями фактора А.

У іменників дана сума квадратів за фактором А складе:



або по другій формулі:



Назад | сторінка 7 з 11 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Податкова база і сума податку
  • Реферат на тему: Розробка заходів щодо вдосконалення інтернет-маркетингу в компанії &Сума Те ...
  • Реферат на тему: Прогноз облікової ставки на Основі методом найменшого квадратів
  • Реферат на тему: Метод найменших квадратів
  • Реферат на тему: Метод найменших квадратів