ка спостережень, причому Значення дисперсії помилок спостережень невідомо, і оцінка її визначається за результатами спостережень.
Задача лінійного регресійного аналізу полягає в тому, щоб за результатами спостережень,
В· отримати найкращі точкові та інтервальні оцінки невідомих параметрів і моделі;
В· перевірити статистичні гіпотези про параметри моделі;
В· перевірити чи досить добре модель узгоджується з результатами спостережень.
Задача лінійного регресійного аналізу вирішується в припущенні, що випадкові помилки не коррелірованни, мають і одну і ту ж дисперсію і нормально розподілені, тобто . У цьому випадку помилки спостережень також є незалежними СВ. p> Для знаходження оцінок параметрів регресії за результатами спостережень використовується метод найменших квадратів. За цим методом в якості оцінок параметрів вибирають такі значення і, які мінімізують суму квадратів відхилень спостережуваних значень випадкових величин, i = 1,2, ..., n, від їх математичних очікувань, тобто суму
.
З необхідних умов мінімуму функції:
В
Отримаємо, що МНК-оцінки параметрів лінійної регресії мають вигляд:
В
Аналогічно визначаються лінійна регресія X на Y
.
Коефіцієнти і знаходяться за формулами:
,
.
Для контролю правильності розрахунків використовується співвідношення:.
Прямі, перетинаються в точці з координатами.
Оцінки параметрів лінійної регресії, одержувані за методом найменших квадратів, при будь-якому законі розподілу помилок спостережень, i = 1,2, .... n, мають наступні характеристики:
. Вони є лінійними функціями результатів спостережень, i = 1,2, ..., n, і незміщеними оцінками параметрів, тобто , J = 0,1. p>. Вони мають мінімальні дисперсії в класі не зміщених оцінок, що є лінійними функціями результатів спостережень. Якщо помилки спостережень коррелірованни і мають нормальний розподіл, тобто , То на додаток до властивостей 1, 2 виконується властивість:
. МНК - оцінки збігаються з оцінками, обчислюваними за методом максимального подібності.
Функція визначає вибіркову регресію Y на X. Остання є оцінкою передбачуваної лінійної регресією за результатами спостережень. Різниці між що спостерігаються значеннями змінної Y при, i = 1,2, ..., n, і розрахунковими значеннями називаються залишками і позначаються:. p> Якість апроксимації результатів спостережень, вибіркової регресії визначається величиною залишкової дисперсії , що обчислюється за формулою:
В
Величина, визначається виразом
В
і називається залишковою сумою квадратів.
У практичних обчисленнях залишкову суму квадратів отримують з тотожності
В
яке записується у вигляді
,
де ...