- середнє квадратичне (у нашому випадку 608,2725)
Аналогічно розраховуємо за формулою (6.3):
6.3)
де N - обсяг сукупності; h - величина інтервалу
Якщо всі емпіричні частоти дорівнюють відповідним теоретичним частотам, то? 2 дорівнює нулю. Очевидно, що чим більше відрізняються емпіричні і теоретичні частоти, тим? 2 більше; якщо розбіжність несуттєво, то? 2 повинно бути малим. Є спеціальні таблиці критичних значень? 2 при 5% -му і 1% -му рівні значущості. Критичні значення залежать від числа ступенів свободи (df - degrees of freedom) і рівня значущості.
Число ступенів свободи розраховується так: якщо емпіричний ряд розподілу має k категорій, то k емпіричних частот f1, f2, ..., fk повинні бути пов'язані наступним співвідношенням:
Якщо параметри теоретичного розподілу відомі, то тільки k - 1 частот можуть брати довільні значення, т. е вільно варіювати, а остання частота може бути знайдена з зазначеного співвідношення. Тому кажуть, що система з k частот завдяки наявності одного зв'язку втрачає одну «ступінь свободи» і має тільки k - 1 ступенів свободи. Крім того, якщо при знаходженні теоретичних частот р параметрів теоретичного розподілу невідомі, то вони повинні бути знайдені за даними емпіричного ряду. Це накладає на емпіричні частоти ще р зв'язків, завдяки чому система втрачає ще р ступенів свободи. Таким чином, число вільно варійованих частот (а значить, і число ступенів свободи) стає рівним:
d.f. =(K - 1) - р=k - (р + 1).
Отримане значення критерію? 2 порівнюється з табличним при числі ступенів свободи, рівному числу груп (з умовою Ф. Йейтса), за мінусом трьох - по числу фіксованих параметрів у формулі нормального закону розподілу та з урахуванням рівності сум теоретичних і фактичних частот.
Сума теоретичних частот нормального розподілу менше суми фактичних частот, так як нормальний закон не обмежений рамками фактичних мінімуму і максимуму.
Ясно, що гіпотеза про відповідність розподілу господарств за врожайністю нормальному закону не може бути відхилена.
Яке практичне значення може мати вироблена перевірка гіпотези? По-перше, відповідність нормальному закону дозволяє прогнозувати, яке число господарств (або частка сукупності) потрапляє в той чи інший інтервал значень ознаки. По-друге, нормальний розподіл виникає при дії на варіацію досліджуваного показника безлічі незалежних факторів. З цього випливає, що не можна істотно знизити варіацію врожайності, впливаючи тільки на один-два керованих фактора, скажімо добрива або енерговитрати.
За допомогою критерію? 2 можна перевіряти не тільки гіпотезу про згоду емпіричного розподілу з нормальним законом, а й з будь-яким іншим відомим законом розподілу - рівномірним розподілом, розподілом Пуассона і т. Д. Наприклад, суд розглядає скаргу відвідувачів казино на те, що, на їхню думку, гральна кістка, якої там користуються, фальшива, деякі числа очок, нібито, випадають частіше, ніж інші, і цим користуються круп'є, обирающие гравців.
Суд призначає експертизу гральної кістки: експерт робить 600 кидків і записує число випали одиниць, двійок, трійок і т. Д.
Отримане емпіричне розподіл порівнюється з теоретичним, т. е рівномірним: у правильній кістки ймовірність випадання кожного числа окулярів повинна бути рівна 1/6, при 600 кидках це дасть по 100 випадінь кожного числа очок. За допомогою критерію? 2 перевіряється нульова гіпотеза про те, що відмінності емпіричного і теоретичного розподілів випадкові, т. Е не є систематичним результатом фальсифікації форми кістки або положення центра ваги в ній; H0: Fфакт=fтеор
Використовуючи методичні вказівки і програму STATISTICA, зробимо згладжування емпіричного розподілу шляхом послідовного побудови нормального, логнормального і прямокутного типів розподілу.
У результаті одержимо наступні таблиці (Таб.6.2 - Таб.6.4)
Перевірка гіпотези про нормальний розподіл змінної Var1.
Перевірка гіпотези про прямокутному розподілі змінної Var1
Перевірка гіпотези про логарифмічно нормальному розподілі змінної Var1.
Проілюструємо отримані дані, згладивши емпіричне розподіл змінної Var1 нормальним розподілом а відповідно з малюнками (Рис.6.1. - рис.6.3.)
Таблиця 6.2
Upper BoundareVariable: Var1, Distribution: Normal (Spreadsheet41) Chi-Square=12,19147, df=3 (adjusted), p=0,00676Observed FrequencyCumulative ObservedPercent ObservedCumul.% Observed Expected Frequency Cumulative ExpectedPercent ExpectedCumul. % ExpectedObserved Expected lt;=339.375212124.4186024.418621.2265421.2265424.6820224.6820-0.22654668.750274831.3953555.814016.8826638.1092019.6310044.313010.11734998.125156317.4418673.255818.2081256.3173221.1722382.6373-3.208121327.5097210.4651283.720914.7511771.0684917....