між змінними x і y відсутня лінійна взаємозв'язок у генеральній сукупності ;: b? 0, тобто між змінними x і y є лінійна взаємозв'язок у генеральній сукупності.
У разі якщо основна гіпотеза виявиться невірною, ми приймаємо альтернативну. Для перевірки цієї гіпотези використовується t-критерій Стьюдента.
Знайдену за даними спостережень значення t-критерію (його ще називають спостережуваним або фактичним) порівнюється з табличним (критичним) значенням, визначеним за таблицями розподілу Стьюдента (які зазвичай наводяться в кінці підручників і практикумів за статистикою або економетрики ).
Табличне значення визначається залежно від рівня значущості (?) і числа ступенів свободи, яке в разі лінійної парної регресії одно (n - 2), n-число спостережень.
Якщо фактичне значення t-критерію більше табличного (по модулю), то основну гіпотезу відкидають і вважають, що з імовірністю (1?) параметр або статистична характеристика у генеральній сукупності значимо відрізняється від нуля.
Якщо фактичне значення t-критерію менше табличного (по модулю), то немає підстав відкидати основну гіпотезу, тобто параметр або статистична характеристика у генеральній сукупності незначимо відрізняється від нуля при рівні значущості?.
tкріт (nm - 1;?/2)=(97; 0.025)=1.984t= f (b; S)
EQ t= f (3.84; 0.7)=5.53
Відзначимо значення на числовій осі.
Відхилення H0, прийняття H1Прінятіе H0Отклоненіе H0, прийняття H12.5% ??95% 2.5% - 1.984 1.9845.53
Оскільки 5.53 gt; 1.984, то статистична значимість коефіцієнта регресії b підтверджується (відкидаємо гіпотезу про рівність нулю цього коефіцієнта).
EQ t= f (a; S) t= f (- 42.1; 11.31)=3.72
Оскільки 3.72 gt; 1.984, то статистична значимість коефіцієнта регресії a підтверджується (відкидаємо гіпотезу про рівність нулю цього коефіцієнта).
Довірчий інтервал для коефіцієнтів рівняння регресії.
Визначимо довірчі інтервали коефіцієнтів регресії, які з надійність 95% будуть наступними:
(b - tкріт Sb; b + tкріт Sb)
(3.84 - 1.984 0.7; 3.84 + 1.984 0.7)
(2.462; 5.221)
З імовірністю 95% можна стверджувати, що значення даного параметра будуть лежати в знайденому інтервалі.
(a - tкріт Sa; a + tкріт Sa)
(- 42.102 - 1.984 11.31; - 42.102 + 1.984 11.31) (- 64.538; - 19.667)
З імовірністю 95% можна стверджувати, що значення даного параметра будуть лежати в знайденому інтервалі.
) F-статистика. Критерій Фішера.
Коефіцієнт детермінації R2 використовується для перевірки суттєвості рівняння лінійної регресії в цілому.
Перевірка значущості моделі регресії проводиться з використанням F-критерію Фішера, розрахункове значення якого знаходиться як відношення дисперсії вихідного ряду спостережень досліджуваного показника і незміщеної оцінки дисперсії залишкової послідовності для даної моделі.
Якщо розрахункове значення з k1=(m) і k2=(nm - 1) ступенями свободи більше табличного при заданому рівні значимості, то модель вважається значущою.
EQ R=1 - f (? ix2;? i2)=1 - f (174252.81; 229104.81)=0.2394
де m - число факторів у моделі.
Оцінка статистичної значущості парної лінійної регресії проводиться за наступним алгоритмом:
. Висувається нульова гіпотеза про те, що рівняння в цілому статистично незначимо: H0: R2=0 на рівні значущості?.
. Далі визначають фактичне значення F-критерію:
EQ F= f (R; 1 - R) f ((n - m - 1); m)
EQ F= f (0.2394; 1 - 0.2394) f ((99-1-1); 1)=30.53
Де=1 для парної регресії.
. Табличне значення визначається за таблицями розподілу Фішера для заданого рівня значущості, беручи до уваги, що число ступенів свободи для загальної суми квадратів (більшої дисперсії) одно 1 і число ступенів свободи залишкової суми квадратів (меншою дисперсії) при лінійної регресії одно n - 2.табл- це максимально можливе значення критерію під впливом випадкових факторів при даних ступенях свободи і рівні значущості?. Рівень значимості?- Ймовірність відкинути правильну гіпотезу за умови, що вона вірна.
Зазвичай? приймається рівною 0,05 або 0,01.
. Якщо фактичне значення F-критерію менше табличного, то кажут...