пояснена) сума квадратів, характеризує випадкову складову розкиду yi щодо лінії регресії.
Зі співвідношень (1.8) і (1.9) випливає, що коефіцієнт детермінації R 2 є ні що інше, як:
R2=ki2: (yi -) 2. (1.10)
У підсумку, коефіцієнт детермінації можна обчислити за (1.8) або за (1.10).
Прогноз значень залежної змінної.
Під прогнозними розуміємо значеннях Yр при певних значеннях пояснюватиме змінної Хр. Так як завдання вирішується в умовах невизначеності то прогноз найзручніше давати на основі інтервальних оцінок, побудованих із заданою надійністю.
Причому тут можливі два підходи:
) пророцтво середнього значення, тобто M (Y: Х=XР);
) пророцтво індивідуальних значень Y: Х=XР.
Інтервальний прогноз для середнього значення обчислюється таким чином:
р=tкр S, (1.11)
де р=a + bxр;
tкр Ї критичне значення, отримане з розподілу Стьюдента при кількості ступенів свободи=n - 2 і заданої ймовірності/2.
Інтервальний прогноз для індивідуального значення обчислюється за формулою:
р=tкр S. (1.12)
. 1.2 Множинна лінійна регресія
Лінійна модель множинної регресії має вигляд:
, (1.13)
де Ї розрахункові значення досліджуваної змінної,
- факторні змінні.
Кожен з коефіцієнтів рівняння має таку економічну інтерпретацію: він показує, наскільки зміниться значення досліджуваного ознаки при зміні відповідного фактора на 1 при незмінних значеннях інших факторних змінних.
Фактичне значення досліджуваної змінної тоді представимо у вигляді:
(1.14)
Для адекватності моделі необхідно, щоб випадкова величина е, що є різницею між фактичними і розрахунковими значеннями, мала нормальний закон розподілу з математичним очікуванням рівним нулю і постійної дисперсією у2.
Маючи n наборів даних спостережень, з використанням уявлення (1.14), ми можемо записати n рівнянь виду:
, (1.15)
де? значення досліджуваної і факторних змінних в i-му спостереженні,
еi Ї відхилення фактичного значення yi від розрахункового значення yрi.
Систему рівнянь (1.15) зручно досліджувати в матричному вигляді:
, (1.16)
де Yв Ї вектор вибіркових даних спостережень досліджуваної змінної (n елементів),
Xв Ї матриця вибіркових даних спостережень факторних змінних (елементів),
А Ї вектор параметрів рівняння (m + 1 елементів),
E Ї вектор випадкових відхилень (n елементів):
(1.17)
При побудові моделі множинної регресії виникає необхідність оцінки (обчислення) коефіцієнтів лінійної функції, які в матричної формі запису позначені вектором A. Формула для обчислення параметрів регресійного рівняння методом найменших квадратів (МНК) за даними спостережень наступна:
. (1.18)
Знаходження параметрів за допомогою співвідношення (1.18) можливо лише в тому випадку, коли між різними стовпцями і різними рядками матриці вихідних даних X відсутня сувора лінійна залежність (інакше не існує зворотна матриця). Ця умова не виконується, якщо існує лінійна або близька до неї зв'язок між результатами двох різних спостережень, або ж якщо такий зв'язок існує між двома різними факторними змінними. Лінійна або близька до неї зв'язок між факторами називається мультиколінеарності. Щоб позбутися мультиколінеарності, в модель включають один з лінійно пов'язаних між собою факторів, причому той, який більшою мірою пов'язаний з досліджуваної змінної.
На практиці щоб позбутися від мультіколленіарності перевіряють для кожної пари факторних змінних виконання наступних умов:
. (1.19)
Тобто коефіцієнт кореляції між двома факторними змінними повинен бути менше 0,8 і, одночасно, менше коефіцієнтів кореляції між досліджуваної змінної і кожної з цих двох факторних змінних. Якщо хоча б одна з умов (1.19) не виконується, то в модель включають тільки один з цих двох факторів, а саме, той, у якого модуль коефіцієнта кореляції з Y більше.
Значимість параметрів моделі множинної регресії aj перевіряється за допомогою t-критерію Стьюдента аналогічно тому, як ми перевіряли значимість коефіцієнтів моделі парної регресії. Для кожного параметра рівняння обчислюється t-статистика:
(1.20)
,
де Sст Ї стандартна помилка оцінки,
bjj Ї діагональний елемент матриці.
Далі за таблицями визначається значення tкр залежно від рівня значущості б і параметра nm - 1. Нарешті, кожна з t-статистик (1.20) порівнюється з табличним значенням. Якщо РtajР gt; tкр, то коефіцієнт aj вважається значимим. В іншому випадку коефіцієнт не є з...