інну. Різні поєднання одних і тих же факторів надають різний вплив на залежну змінну. Внаслідок цього з'являється не?? Бходімо вибору найкращої моделі, тому що перебирати всі можливі варіанти поєднання факторів і будувати безліч рівнянь регресії (кількість яких може бути дуже велике) просто не має сенсу.
Таким чином методи покрокового регресійного аналізу дозволяють уникнути настільки громіздких розрахунків і отримати досить надійну і повну модель залежності досліджуваної ознаки від ряду пояснюють змінних.
Як було сказано вище, основою багатокрокового регресійного аналізу є побудова рівняння регресії. Розглянемо більш детально його систему і основні поняття.
У загальному вигляді багатовимірна лінійна регресійна модель залежності y від пояснюють змінних,, ..., має вигляд:
(3.12)
Для оцінки невідомих параметрів взята випадкова вибірка обсягу n з (k +1)-мірної випадкової величини (y,,, ...,).
В матричної формі модель має вигляд:
(3.13)
де,,,?=(3.14)
вектор-стовпець фактичних значень залежної змінної розмірності n;
матриця значень пояснюють змінних розмірності n * (k +1);
вектор-стовпець невідомих параметрів, що підлягають оцінці, розмірності (k +1);
вектор-стовпець випадкових помилок розмірності n з математичним очікуванням ME=0 і ковариационной матрицею
(3.15)
відповідно, при цьому
-одинична матриця розмірності (nxn).
Оцінки невідомих параметрів знаходяться методом найменших квадратів, мінімізуючи скалярную суму квадратів по компонентах вектора?.
Далі підставивши вираз
(3.16)
в
отримуємо скалярную суму квадратів
Умовою звернення отриманої суми в мінімум є система нормальних рівнянь:
, (j=0,1,2, ..., k).
В результаті диференціювання виходить:
.
При заміні вектора невідомих параметрів? на оцінки, отримані методом найменших квадратів, отримуємо такий вираз:
. (3.17)
Далі помноживши обидві частини рівняння зліва на матрицю, отримаємо
(3.18)
Так як, тоді.
Отримані оцінки вектора b не є зміщеними і ефективними.
Коваріаційна матриця вектора b має вигляд:
де - залишкова дисперсія.
Елементи головної діагоналі цієї матриці являють собою дисперсії вектора оцінок b. Інші елементи є значеннями коефіцієнтів коваріації:
, (3.19) де,.
Таким чином, оцінка - це лінійна функція від залежною змінною. Вона має нормальний розподіл з математичним очікуванням і дисперсією
. (3.20)
Несмещенная оцінка залишкової дисперсії визначається за формулою:
...