стереження.
Зв'язок між у і х визначає знак коефіцієнта регресії b (якщо gt; 0 - прямий зв'язок, інакше - зворотна). У нашому прикладі зв'язок пряма.
Коефіцієнт детермінації.
Квадрат (множинного) коефіцієнта кореляції називається коефіцієнтом детермінації, який показує частку варіації результативної ознаки, пояснень варіацією факторного ознаки.
Найчастіше, даючи інтерпретацію коефіцієнта детермінації, його виражають у процентах.2=0.9692=0.9384
т.е. в 93.84% випадків зміни х призводять до зміни y. Іншими словами - точність підбору рівняння регресії - висока. Решта 6.16% зміни Y пояснюються чинниками, які не врахованими в моделі (а також помилками специфікації).
Таблиця. Для оцінки якості параметрів регресії побудуємо розрахункову таблицю
xyy (x) (yi -y cp) 2 (yy (x)) 2 | y - yx |:y322024.43229.3119.610.22302423.34124.160.430.0275362826.651.021.950.0499403028.7826.451.50.0408413129.3217.162.820.0542473332.584.590.180.0127563437.471.3112.060.1543736.393.450.380.0166603839.658.162.710.0433554036.9323.599.430.0768614140.1934.310.660.0198674343.4561.730.20.0105694544.5497.160.210.0103764848.34165.310.120.00713724492492847.7152.260.69
Значимість коефіцієнта кореляції.
Висуваємо гіпотези: 0: r xy=0, немає лінійного взаємозв'язку між змінними; 1: r xy? 0, є лінійна взаємозв'язок між змінними;
Для того щоб при рівні значущості? перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта кореляції нормальної двовимірної випадкової величини при конкуруючої гіпотезі H 1? 0, треба обчислити спостережуване значення критерію (величина випадкової помилки)
і по таблиці критичних точок розподілу Стьюдента, за заданим рівнем значущості? і числу ступенів свободи k=n - 2 знайти критичну точку tкріт двосторонньої критичної області. Якщо tнабл lt; tкріт підстав відкинути нульову гіпотезу. Якщо | tнабл | gt; tкріт - нульову гіпотезу відкидають.
По таблиці Стьюдента з рівнем значущості?=0.05 і ступенями свободи k=12 знаходимо tкріт:
крит (nm - 1;?/2)=(12; 0.025)=2.179
де m=1 - кількість пояснюють змінних.
Якщо | tнабл | gt; tкрітіч, ??то отримане значення коефіцієнта кореляції визнається значущим (нульова гіпотеза, яка стверджує рівність нулю коефіцієнта кореляції, відкидається).
Оскільки | tнабл | gt; tкріт, то відхиляємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнт кореляції статистично - значущий
У парній лінійної регресії t2r=t2b і тоді перевірка гіпотез про значущість коефіцієнтів регресії і кореляції рівносильна перевірці гіпотези про істотність лінійного рівняння регресії.
Інтервальна оцінка для коефіцієнта кореляції (довірчий інтервал).
Довірчий інтервал для коефіцієнта кореляції.
(0.813; 1)
Індивідуальні довірчі інтервали для Y при даному значенні X.
(a + bxi ±?)
де
крит (nm - 1;?/2)=(12; 0.025)=2.179
Таблиця
x i y=7.04 + 0.54x i? i y min=y -? i y max=y +? i 3224.435.0119.4129.443023.345.0818.2628.423626.64.921.731.514028.784.8223.9633.594129.324.824.5234.124732.584.7327.8637.315637.474.7232.7542.195436.394.7131.6741.16039.654.7634.8844.415536.934.7232.2141.646140.194.7835.4144.976743.454.8938.5648.346944.544.9439.5949.48
З імовірністю 95% можна гарантувати, що значення Y при необмежено великому числі спостережень не вийде за межі знайдених інтервалів.
Перевірка гіпотез щодо коефіцієнтів лінійного рівняння регресії.
) t-статистика. Критерій Стьюдента.
крит (nm - 1;?/2)=(12; 0.025)=2.179
Оскільки 13.51 gt; 2.179, то статистична значимість коефіцієнта регресії b підтверджується (відкидаємо гіпотезу про рівність нулю цього коефіцієнта).
Оскільки 3.27 gt; 2.179, то статистична значимість коефіцієнта регресії a підтверджується (відкидаємо гіпотезу про рівність нулю цього коефіцієнта).
Довірчий інтервал для коефіцієнтів рівняння регресії.
Визначимо довірчі інтервали коефіцієнтів регресії, які з надійність 95% будуть наступними:
(b - tкрітSb; b + tкрітSb)
(0.54 - 2.179 0.0402; 0.54 + 2.179 0.0402)
(0.456; 0.631)
З імовірністю 95% можна стверджувати, що значення даного параметра будуть лежати в знайденому інтервалі.
(a - tкрітSa; a + tкріт Sa)
(7.036 - 2.179 2.15; 7.036 + 2.179 2.15)
(2.344; 11.728)
З імовірністю 95% можна стверджувати, що значення дано...