еличини X, представленої вибіркою xS, має задане значення?. Тест вимагає, щоб віддана в нього вибірка була вибіркою нормальної випадкової величини.
В процесі своєї роботи тест обчислює t-статистику
Якщо величина X розподілена нормально, то статистика t матиме розподіл Стьюдента з N - 1 ступенями свободи. Це дозволяє нам використовувати розподіл Стьюдента для визначення рівня значущості, відповідного отриманим значенням t-статистики.
Зауваження.
У разі якщо X не є нормальною випадковою величиною, то величина t матиме іншу, невідоме розподіл, і, строго кажучи, t-тест Стьюдента не можна застосовувати. Проте відповідно до центральною граничною теоремою при зростанні розміру вибірки розподіл t буде прагнути до розподілу Стьюдента. Таким чином, якщо розмір вибірки досить великий, то ми можемо використовувати t-тест, навіть якщо вимога нормальності розподілу не виконується. Однак не існує простого способу визначити, яке N досить великий. У кожному конкретному випадку є своя межа, що залежить від того, наскільки досліджуване розподіл відхиляється від нормального. Деякі джерела наводять як «досить великого N» 30, але навіть цей розмір вибірки може виявитися недостатній. Альтернативою в цьому випадку може бути непараметрический тест - критерій знаків lt; C: Documents and Settings Admin Local Settings Temp Rar $ DI15.218 signtest.php gt; або W-критерій Уілкоксона lt; C: Documents and Settings Admin Local Settings Temp Rar $ DI15.218 wilcoxonsignedrank.php gt ;.
При необхідності порівняння тільки двох груп можна використовувати окремий випадок дисперсійного аналізу - критерій Стьюдента. Якщо при проведенні t-аналізу є тільки середні значення, величина стандартного відхилення і чисельністю груп можна піти шляхом вивчення можливості R.
Нижче наведемо порівняння статистичних показників розрахованих різними способами (табл.5.3)
Таблиця 5.3
№Названіе показателяЗначеніе в ППП STATISTIKAЗначенія ручного розрахунку по згрупованим данним1Средняя арифметическая755,7558779,62Медиана568,0000578,83Мода439,0000448,04Дисперсия369995,4389243,35Верхний квартіль362,0000387,06Ніжній квартіль1054,00001069,07Размах варіаціі2635,00002635,08Среднее квадратичне отклоненіе608,2725612,275
6. Згладжування емпіричного розподілу
Перевірка гіпотези про закон розподілу
Порівнюючи отримані величини теоретичних частот f 'c емпіричними (фактичними) частотами f, переконуємося, що їх розбіжності можуть бути вельми невеликі.
У дане розподіл близько до нормального.
Об'єктивна характеристика відповідності теоретичних і емпіричних частот може бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди.
Для оцінки близькості емпіричних і теоретичних частот застосовуються критерій згоди Пірсона, критерій згоди Романовського, критерій згоди Колмогорова.
Найбільш поширеним є критерій згоди Пірсона ,, який можна представити як суму відносин квадратів розбіжностей між f 'і f до теоретичних частотам за формулою 6.1:
(6.1)
Обчислення значення критерію необхідно порівняти з табличним (критичним) значенням. Табличне значення визначається за спеціальною таблицею, воно залежить від прийнятої ймовірності Р і числа ступенів свободи k (при цьому k=m - 3, де m - число груп в ряду розподілу для нормального розподілу). При розрахунку критерію згоди Пірсона повинне дотримуватися така умова: достатньо великим має бути число спостережень (n 50), при цьому якщо в деяких інтервалах теоретичні частоти lt; 5, то інтервали об'єднують для умови gt; 5.
Якщо, то розбіжності між емпіричними і теоретичними частотами розподілу можуть бути випадковими і припущення про близькість емпіричного розподілу до нормального не може бути відкинуто.
Використовуючи статистичну таблицю 1.4 (стор.19) і методичні вказівки зробимо розрахунок і аналіз значень критерію згоди Пірсона, об'єднавши деякі інтервали з частотами lt; 5 попередніх інтервальних рядів:
Таблиця 6.1 Таблиця для розрахунку згладжування емпіричного розподілу.
№ 11034017521-0,95476-20,05-59,5298-108,938234067050527-0,41224-11,1305-42,4894-113,64736701000835150,1302771,9541624,14430928,43563410001300115090,6481375,8332377,4225380,335247513001660148051,1906575,9532874,2084980,14886616601990182551,7578378,7891876,2132520,23691719902650232042,57161710,286475,8173690,567753k86-74,2132-192,86
розрахуємо в Microsoft Excel за формулою (6.2)
(6.2)
Де x - значення досліджуваного ознаки;
- середнє арифметичне (у нашому випадку 755,7558);
...