- 14546,4 + 12471,7х1 + 1848,81х2 + 12172,7х3 - 457,349х4 + 4913,2х5-11632,1х6-434,074х7 + 4211,7 х8 + е.
Проведемо перевірку на наявність мультиколінеарності методом інфляційних залишків:
Клас готелю 1,477
Тривалість відпочинку 1,296
Тип харчування 1,083
Категорія номера 1,455
Гаряча путівка 1,158
Курорт 1,084
розташування готелю (лінія) 1,227
Пляж 1,294
Всі інфляційні чинники менше 10, значить, мультиколінеарності відсутня.
Перевірка значущості рівняння регресії
Подібна процедура допоможе нам встановити, чи відповідає економетрична модель наявними даними.
Н0: все? i=0. Підтвердження цієї гіпотези говорить про незначущості побудованої моделі. Сформулюємо альтернативну гіпотезу
Н1:? j? 0 про існування хоча б одного параметра, відмінного від нуля, що свідчило б про значущість моделі.
Для перевірки гіпотези будемо використовувати F-критерій:
Для нашої моделі, використовуючи можливість проведення дисперсійного аналізу в Gretl, знаходимо:
=+2089100000,00/164803000,00=12,68
Зіставимо з Fтабл=2,17399, з числом ступенів свободи? 1=8,? 2=41 і довірчою ймовірністю 95%: табл lt; , Робимо висновок, що вибіркові дані не підтверджують нульову гіпотезу. Всі або деякі змінні мають вплив на результуючий ознака. Дізнаємося, які саме.
Перевірка значущості оцінок параметрів рівняння регресії
Сформулюємо дві гіпотези:
Н0: про те, що параметр генерального рівняння регресії? i не значима відрізняється від нуля, що означає відсутність впливу на результуючу змінну i-го фактора. А також другу гіпотезу
Н1:? j? 0 про значимому відміну від нуля параметра, слідство з якого - визнання впливу фактора на функцію відгуку.
В якості статистичного критерію будемо використовувати t-статистику Стьюдента.
Визначимо значення
і зіставимо його з табличним значенням, при кількості ступенів свободи?=41=1,6828.
Якщо, то? j значущий, якщо співвідношення не виконується, то оцінка визнається незначимой.
Для значимого параметра побудуємо довірчий інтервал:
Зробимо обчислення і занесемо їх у таблицю 5.
Таблиця 6 - Перевірка значущості оцінок параметрів
рівняння регресії
КоеффіціентОценкаСт.ошібкаtрасч tтаблВиводДоверітельний інтервалb0-14546,425094,6-0,5797 1,68288, р=0,05Не значімb1 (hotel) 12471,73184,463,9164 1,68288, р=0 , 05Значім6040,59; 18902,9b2 (duration) 1848,811348,71,37081,68288, р=0,05Не значімb3 (meal) 12172,72596,514,68811,68288, р=0,05Значім6928,93; 17416, 4b4 (room) 4913,21576,833,11591,68288, р=0,05Значім1728,72; 8097,67b5 (line) - 434,0742646,47-0,16401,68288, р=0,05Не значімb6 (place) 4211,71925,532,18731,68288, р=0,05Значім323,004; 8100,39b7 (last_min) - 11632,13936,54-2,95491,68288, р=0,05Значім - 19582,1;- 3682,04b8 (beach) - 457,3494985,72-0,09171,68288, р=0,05Не значущий
Таким чином, оцінки b1, b3, b4, b6 і b7 значимі при 95% довірчої ймовірності, а b0, яку ми могли б проінтерпретувати, як середнє значення ціни, b2, b5, b8 виявилися не значущим. Знову звернімося до процедури МНК. Послідовно виключимо незначущі фактори з рівняння, звертаючи увагу на значення R2.
Вихідне рівняння мало вигляд:
у?=- 14546,4 + 12471,7х1 + 1848,81х2 + 12172,7х3 - 457,349х4 + 4913,2х5-11632,1х6-434,074х7 + 4211,7 х8 + е, R2= 0,7121.
Виключимо змінну х8 (пляж) з рівняння, так як вона має найменшу по модулю tрасч, отримаємо R2=0,7120.
Далі видалимо х5 (розташування готелю), R2=0,7119.
Після виключення const, R2=0,9799 і значущою стала оцінка b2.
Таким чином, отримали наступне вибіркове рівняння регресії:
? у=11484,3 х1 + 1077,14х2 + 11732,7х3 + 4707,24 х4 +3935,34 х6 - 12350,0х7 + е.
Перевіримо якість рівняння регресії за коефіцієнтом детермінації R2.=0,9799 і R2іспр=0,9776, що говорить про досить хорошою описової здатності моделі.
Проаналізуємо статистичну значущість коефіцієнта детермінації. Сформулюємо гіпотези:
Н0: R2=0. Якщо дана гіпотеза підтверджується, то ми можемо стверджувати, що сукупний вплив поясн...