лою:
, (7)
де - середнє твір факторного та результативного ознаки:
; (8)
- середнє значення факторного ознаки:
; (9)
- середнє значення результативної ознаки:
; (10)
- середньоквадратичне відхилення результативної ознаки:
; (11)
- середньоквадратичне відхилення факторного ознаки:
. (12)
Квадрат лінійного коефіцієнта кореляції називається лінійним коефіцієнтом детермінації:
r 2 = d. (13)
Коефіцієнт детермінації показує, яка частина загальної варіації результативної ознаки (y) пояснюється впливом досліджуваного фактора (x).
Для отримання висновків про практичної значущості синтезованих в аналізі моделей, показаннями тісноти зв'язку дається якісна оцінка. Це здійснюється на основі шкали Чеддока. br/>
Таблиця 1 - Шкала Чеддока
Показання
тісноти зв'язку
0,1 - 0,3
0,3 - 0,5
0,5 - 0,7
0,7 - 0,9
0,9 - 0,999
Характеристика
сили зв'язку
слабка
помірна
помітна
висока
вельми
висока
При r = 1 зв'язок є функціональною, при r = 0 зв'язок відсутня. Якщо коефіцієнт кореляції зі знаком "+", то зв'язок пряма, якщо зі знаком "-", то зв'язок зворотна.
Для практичного використання моделей регресії важлива оцінка їх адекватності, тобто відповідності фактичним статистичними даними.
Оскільки кореляційно-регресійний аналіз зв'язку між ознаками проводиться для обмеженою за обсягом сукупності, то параметри рівняння регресії, коефіцієнти кореляції і детермінації можуть бути спотворені дією випадкових факторів. Щоб перевірити наскільки ці показники характерні для всієї генеральної сукупності, чи не є вони результатом збігу випадкових обставин, необхідно перевірити адекватність побудованої статистичної моделі.
При чисельності об'єктів аналізу до 30 одиниць виникає необхідність перевірки значимості (суттєвості) коефіцієнту регресії. При цьому з'ясовують наскільки обчислені параметри характерні для відображення умов: чи не є отримані значення параметрів результатом дії випадкових причин.
Значимість параметрів простий лінійної регресії здійснюється за допомогою t-критерію Стьюдента. При цьому обчислюють фактичні (розрахункові) значення t-критерію:
для параметра а 0 :
, (14)
де - середньо квадратичне відхилення результативної ознаки
у від вирівняних значень у x , які розраховуються за рівнянням регресії:
. (15)
для параметра а 1 :
. (16)
Обчислені за формулами (13) і (15) значення, порівнюються із критичними t до , які приймаються згідно з даними таблиці Стьюдента з урахуванням заданого рівня значущості (a) і числа ступенів свободи (K = n - 2). У соціально-економічних дослідженнях рівень значущості a зазвичай приймають рівним 5%, тобто a = 0,05, що відповідає довірчій ймовірності 95%. Параметр визнається істотним за умови, якщо t ф > t до . У такому випадку практично неймовірно, що знайдені значення параметрів обумовлені тільки випадковими збігами.
Показники тісноти зв'язку, обчислені за даними порівняно невеликий статистичної сукупності, також можуть спотворюватися дією випадкових причин. Це викликає необхідність перевірки їх суттєвості, що дає можливість поширювати висновки з результатами вибірки на генеральну сукупність.
Для оцінки значущості лінійного коефіцієнта кореляції r застосовується t-критерій Стьюдента. При цьому визначається фактичне (розрахункове) значення критерію ( t r ф ):
, (17)
де n-2 - число ступенів свободи при заданому рівні значущості a і обсязі вибірки n.
Обчислення значення t r ф порівнюється з критичним t k , яке береться з таблиці Стьюдента з урахуванням заданого рівня значущості a і числа ступенів свободи k = n - 2. p> Якщо t r ф > T k , то це свідчить про значущість лінійного коефіцієнта кореляції r і суттєвості зв'язку між ознакою-фактором і ознакою-результатом.
Оскільки не всі фактичні значення результативної ознаки лежать на лінії регресії, більш справедливо для запису рівняння кореляційної залежності скористатися наступною формулою:
, (18) <...