ю і випадкової складових.
В
де f - функція регресійної залежності, а v - адитивна випадкова величина з нульовим матожиданием. Припущення про характер розподілу цієї величини називається гіпотезою породження даних. Звичайно передбачається, що величина v має гауссово розподіл з нульовим середнім і дисперсією .
Задача знаходження регресійній моделі декількох вільних змінних ставиться таким чином. Задана вибірка - безліч значень вільних змінних і безліч відповідних їм значень залежної змінної. Ці безлічі позначаються як D, безліч вихідних даних . Задана регресійна модель - параметричне сімейство функцій f (w, x) залежить від параметрів і вільних змінних x. Потрібно знайти найбільш ймовірні параметри :
В
Функція ймовірності p залежить від гіпотези породження даних і задається байєсівського висновком або методом найбільшої правдоподібності.
Лінійна регресія передбачає, що функція f залежить від параметрів w лінійно. При цьому лінійна залежність від вільної змінної x необов'язкова,
В
У випадку, коли функція лінійна регресія має вигляд
В
тут - компоненти вектора x.
Значення параметрів у випадку лінійної регресії знаходять за допомогою методу найменших квадратів. Використання цього методу обгрунтовано припущенням про гауссовскому розподілі випадкової змінної. p align="justify"> Різниці між фактичними значеннями залежної змінної і відновленими називаються регресійний залишками (residuals). У літературі використовуються також синоніми: нев'язки і помилки. Однією з важливих оцінок критерію якості отриманої залежності є сума квадратів залишків:
В
Тут SSE - Sum of Squared Errors. p align="justify"> Дисперсія залишків обчислюється за формулою
В
Тут MSE - Mean Square Error, середньоквадратична помилка. p align="justify"> Нелінійні регресійні моделі - моделі виду , які не можуть бути представлені у вигляді скалярного твори
В
Де - параметри регресійної моделі, x - вільна мінлива з простору Rn, y - залежна змінна, v - випадкова величина і - функція з деякого заданого безлічі.
Задача
По двох незалежним вибірках об'ємом n1 = 30 і n2 = 15, добутих з нормальних генеральних сукупностей, знайдені вибіркові середні = 25 і = 27. Дисперсії генеральних сукупностей відомі = 1,3 і = 1,6. На рів...