залежні стовпці, і, по властивості визначників матриці, det (XTX=0).
Вид мультиколінеарності, при якому факторні змінні зв'язані деякою стохастичною залежністю, називається частковою. Якщо між факторними змінними наявний високий ступінь кореляції, то матриця (XTX) близька до виродженої, т. Е. Det (XTX? 0) (чим ближче до 0 визначник матриці межфакторной кореляції, тим сильніше мультиколінеарності факторів і ненадійніше результати множинної регресії).
У нашому випадку все парні коефіцієнти кореляції | r | lt; 0.7, що говорить про відсутність мультиколінеарності факторів.
Аналіз першого рядка цієї матриці дозволяє зробити відбір факторних ознак, які можуть бути включені в модель множинної кореляційної залежності. Факторні ознаки, у яких | ryxi | lt; 0.5 виключають з моделі. Можна дати наступну якісну інтерпретацію можливих значень коефіцієнта кореляції (за шкалою Чеддока): якщо | r | gt; 0.3 - зв'язок практично відсутній; 0.3? | r |? 0.7 - зв'язок середня; 0.7? | r |? 0.9 - зв'язок сильна; | r | gt; 0.9 - зв'язок вельми сильна.
Перевіримо значущість отриманих парних коефіцієнтів кореляції з допомогою t-критерію Стьюдента. Коефіцієнти, для яких значення t-статистики по модулю більше знайденого критичного значення, вважаються значущими.
Розрахуємо спостережувані значення t-статистики для ryx1 за формулою:
tнабл=ryx1 f ( r (nm - 1); r (1 - ryx1 2))
де m=1 - кількість факторів у рівнянні регресії.
tнабл=0.14 f ( r (86 - 1 - 1); r (1 - 0.142))=1.26
По таблиці Стьюдента знаходимо tтабл
крит (nm - 1;?/2)=(84; 0.025)=1.984
Оскільки tнабл lt; tкріт, то приймаємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнт кореляції статистично - не означає
Розрахуємо спостережувані значення t-статистики для ryx2 за формулою:
tнабл=0.32 f ( r (86 - 1 - 1); r (1 - 0.322))=3.1
Оскільки tнабл gt; tкріт, то відхиляємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнт кореляції статистично - значущий
Розрахуємо спостережувані значення t-статистики для ryx3 за формулою:
tнабл=0.0325 f ( r (86 - 1 - 1); r (1 - 0.03252))=0.3
Оскільки tнабл lt; tкріт, то приймаємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнт кореляції статистично - не означає
Розрахуємо спостережувані значення t-статистики для ryx4 за формулою:
tнабл=0.19 f ( r (86 - 1 - 1); r (1 - 0.192))=1.78
Оскільки tнабл lt; tкріт, то приймаємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнт кореляції статистично - не означає
Розрахуємо спостережувані значення t-статистики для ryx5 за формулою:
EQ tнабл=0.034 f ( r (86 - 1 - 1); r (1 - 0.0342))=0.31
Оскільки tнабл lt; tкріт, то приймаємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнт кореляції статистично - не означає
Розрахуємо спостережувані значення t-статистики для ryx6 за формулою:
tнабл=0.26 f ( r (86 - 1 - 1); r (1 - 0.262))=2.51
Оскільки tнабл gt; tкріт, то відхиляємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнт кореляції статистично - значущий
Таким чином, зв'язок між (y і xx2), (y і xx6) є суттєвою, тобто ціна квартир залежить від житлової площі і розташування в центрі або на околиці.
Найбільший вплив на результативну ознаку надає чинник x2 (r=0.32), значить, при побудові моделі він увійде в регресійне рівняння першого.
Тестування і усунення мультиколінеарності.
Найбільш повним алгоритмом дослідження мультиколінеарності є алгоритм Фаррара-Глобера. З його допомогою тестують три види мультиколінеарності:
. Всіх факторів (? 2 - хі-квадрат).
. Кожного фактора з іншими (критерій Фішера).
. Кожної пари факторів (критерій Стьюдента).
Перевіримо змінні на мультиколінеарності методом Фаррара-Глоубера по першому вигляду статистичних критеріїв (критерій хі-квадрат ).
Формула для розрахунку значення статистики Фаррара-Глоубера:
? 2=- [n - 1- (2m + 5)/6] ln (det [R])
де m=6 - кількість факторів,...