3
89
Прийняті в таблиці позначення:
Y - ціна квартири - це залежна змінна (тис. дол.)
В якості незалежних, пояснюють змінних обрані
Х1 - місто області: 1 - Подольськ, 0 - Люберці;
Х2 - число кімнат у квартирі;
Х3 - загальна площа квартири, кв. м.
1) Розрахунок матриці парних коефіцієнтів кореляції; оцінка статистичної значущості коефіцієнтів кореляції.
Для обчислення матриці парних коефіцієнтів кореляції використовуємо інструмент Кореляція (Аналіз даних в Excel)
Таблиця 2 - Матриця парних коефіцієнтів кореляції
В
Ціна квартири
Місто області
Число кімнат у квартирі
Загальна площа квартири
Ціна квартири
1
Місто області
-0,403
1
Число кімнат у квартирі
0,688
-0,155
1
Загальна площа квартири
0,846
-0,082
0,806
1
Аналіз матриці парних коефіцієнтів кореляції показує, що залежна змінна (ціна квартири) має тісний зв'язок із загальною площею квартири (ryx3 = 0,846) і з числом кімнат у квартирі.
Оцінку статистичної значущості коефіцієнтів кореляції виконуємо з використанням t-критерію Стьюдента. Фактичне значення цього критерію визначаємо за формулою (1):
(1)
Критичне значення t-статистики Стьюдента при рівні значущості 0,05 і числі ступенів свободи 38: t розр ≈ 2,0244
Таблиця 3
t набл
Y-X1
2,717131
Y-X2
5,847482
0,967211
Y-X3
9,762849
0,509262
8,393933
З таблиці (3) видно що для всіх коефіцієнтів матриці t набл > t розр, отже всі коефіцієнти кореляції статистично значущі. Між параметрами Y і X3 найбільш тісний статистична взаємозв'язок.
2) Побудова поля кореляції результативної ознаки і найбільш тісно пов'язаного з ним фактора.
Поле кореляції має вигляд, наведений на рис.1. Витягнутість хмари точок на діаграмі розсіювання вздовж похилій прямій дозволяє зробити припущення, що існує деяка об'єктивна тенденція прямої лінійного зв'язку між значеннями змінних Х3 і Y.
В
3) Розрахунок параметрів лінійної парної регресії для кожного фактора Х.
Для розрахунку коефіцієнтів регресії використовуємо інструмент регресія (Аналіз даних в Excel)
В
Коефіцієнти
Y-перетин
117,504
X1
-41,484
В
Коефіцієнти
Y-перетин
13,212
X2
33,516
В
Коефіцієнти
Y-перетин
-13,109
X3
1,543
Моделі лінійної регресії будуть мати вигляд:
для Х1 - Y = 117,504 - 41,484 X1
для Х2 - Y = 13,212 + 33,516 X2
для Х3 - Y = -13,109 + 1,543 X3
4) Оцінка якості кожної моделі через коефіцієнт детермінації, середньої помилки апроксимації і F-критерію Фішера. Вибір кращої моделі. p> Модель Х1 : R 2 = 0,163 ; = 18,259%; F = 7,383 .
Коефіцієнт детермінації дорівнює 0,163, він показує, що близько 16,3% варіацій залежною змінною враховано в моделі і обумовлено впливом включених факторів, тобто ціна квартири тільки на 16,3% залежить від міста.
Критерій Фішера дорівнює 7,383. Табличне значення (при k1 = 5, k2 = 40-5-1 = 34 і а = 0,05) одно 2,48. Звідси F> Fтабл. Це означає, що рівняння регресії з ймовірністю 0,95, слід визнати адекватним.
Середня помилка апроксимації = 18,259%, т.е розрахункові значення відрізняються від фактичних значень на 18,26%. p> Модель Х2: R 2 = 0,474; = 9,053%; F = 9,217.
...