тори колінеарні. br/>
Сервіс - Аналіз даних - Кореляція
Аналіз матриці коефіцієнтів парної кореляції показує, що залежна змінна, тобто середня очікувана тривалість життя, має тісний зв'язок з коефіцієнтом дитячої смертності (ryx4 = -0,969), з ВВП в паритетах купівельної спроможності (ryx1 = 0,780), з темпами приросту населення (ryx2 = 0,725). Однак фактори Х2 і Х3 тісно пов'язані між собою (rx2x3 = 0,874) і фактори Х2 і Х4 також тісно пов'язані (rx2x4 = 0,736), що свідчить про наявність коллинеарности. p align="justify"> Колінеарність - залежність між факторами. В якості критерію мультиколінеарності може бути прийнято дотримання наступних нерівностей:
r (xjy)> r (xkxj); r (xky)> r (xkxj). br/>
коллинеарности фактори х2 і х3, х2 і х4, а також х3 і х4.
. Побудуємо рівняння множинної регресії, обгрунтувавши відбір факторів. p align="justify"> З моделі виключимо фактор х3, так як залежна змінна слабо залежить від цього чинника і щоб виключити мультиколінеарності.
Сервіс - Аналіз даних - Регресія
ВИСНОВОК ІТОГОВРегрессіонная статістікаМножественний R0, 972926R-квадрат0, 946586Нормірованний R-квадрат0, 94436Стандартная ошібка2, 267593Наблюдения76Дисперсионный аналіз dfSSMSFЗначімость КоеффіціентиСтандартная ошібкаt-статістікаP-ЗначеніеНіжніе 95% Верхні
Рівняння множинної регресії:
y = 75,438 + 0,045 x1 - 0,045 x2 - 0,239 x4
. Проведемо тестування помилок рівняння множинної регресії на гетероскедатічность, застосувавши тест Гельфельда-Квандта. p align="justify"> Впорядкуємо за зростанням значення змінної, потім виключимо З центральних спостережень, при цьому (n - C)/2> p, де р - число оцінюваних параметрів, потім розділимо сукупність на дві групи і визначимо в кожній групі залишкові суми S1 і S2 і знаходимо їх ставлення R.
Гетероскедатічность по Y:
Критерій Табличне значення F-критерію
, 75> 3,9685
Гетероскедатічность по X1:
Критерій Табличне значення F-критерію
, 08> 3,9685
Гетероскедатічность по X2:
Критерій Табличне значення F-критерію
, 59> 3,9685
Гетероскедатічность по X4:
Критерій Табличне значення F-критерію
, 540> 3,9685
Всі значення більше табличного значення F-критерію, отже, дисперсії залишкових величин не рівні.
. Оцінимо статистичну значущість рівняння множинної регресії. Які фактори значимо впливають на формування середньої тривалості життя в цьому рівнянні? Табл = 3,9685
Так як F ...