ображення називається полем кореляції (діаграмою розсіювання).
Виходячи з отриманої конфігурації точок, вибирається найбільш підходящий вид параметричної функціональної залежності f (x). На малюнку 1.3.1 наведено приклад поля кореляції для деякої вибірки об'ємом 11 спостережень (кожному спостереженню відповідає одна точка) з графіками двох функціональних залежностей - лінійної функції і параболи.
Емпіричний метод полягає в наступному. Вибирається деяка параметрична функціональна залежність f (x) (див., Наприклад, 1.3.3-1.3.7). Для побудови за вибіркою оцінки f '(x) цієї залежності найчастіше використовується метод найменших квадратів (МНК).
Відповідно до методу найменших квадратів значення параметрів функції f (x) (будемо позначати їх через a, b) вибираються таким чином, щоб сума квадратів відхилень вибіркових значень f (x) від значень f () була мінімальної
, (1.3.8)
мінімум шукається за параметрами ab, які входять в залежність f '(x).
Знайдені значення параметрів, які мінімізують зазначену суму квадратів різниць, називаються оцінками невідомих параметрів регресії за методом найменших квадратів (оцінками МНК). Вибіркова регресія y =F (x) (або =f (), i=1, K, n), в яку підставлені знайдені значення, вже не містить невідомих параметрів і є оцінкою теоретичної регресії. Саме цю залежність f '(x) будемо розглядати як емпіричну усереднену залежність досліджуваного показника від роз'яснюючого фактора.
Після знаходження емпіричного рівняння регресії обчислюються значення =f () і залишки =? ', I=1, n. За величиною n залишкової суми квадратів
можна судити про якість відповідності емпіричної функції f '(x) наявним статистичним спостереженням. Перебираючи різні функціональні зависимости й, кожен раз, діючи таким чином можна практично підібрати найбільш підходящу функцію для опису наявних даних.
Аналітичний метод зводиться до спроби з'ясування змістовного сенсу залежно досліджуваного показника від роз'яснюючого фактора і подальшого вибору на цій основі відповідної функціональної залежності. Так, якщо y - витрати фірми, x - обсяг випущеної продукції за місяць, то неважко отримати наступну модель залежності витрат від обсягу випущеної продукції:
y =? +? x +? ,
де?- Умовно-постійні витрати,? x - умовно-змінні витрати.
У практиці економетричного аналізу часто використовують лінійну парну регресію. У моделі парної лінійної регресії залежність 1.3.1 між змінними представляється у вигляді
y =? +? x + ?, (1.3.9)
т.е. теоретична регресія має вигляд 1.3.3.
На основі вибіркових спостережень оцінка теоретичної регресії - вибіркова (емпірична) регресія y будується у вигляді:
'= a + bx, (1.3.10)
де a, b є оцінками параметрів?,? теоретичної регресії.
1.4 Оцінка параметрів. Метод найменших квадратів
Розглядається модель парної лінійної регресії
=? +? +, I=1, n.
На основі емпіричних спостережень побудуємо оцінку теоретичної регресії - знайдемо вибіркове рівняння регресії
'= a + bx, i=1, n.
Оцінки a, b параметрів?,? визначаються за методом найменших квадратів зі співвідношення:
т.е. a, b вибираються таким чином, щоб мінімізувати суму квадратів відхилень вибіркових (емпіричних) значень показника від розрахункових '.
підставимо у завдання формулу:
В даному випадку у нас a і b - змінні, а х і в - параметри. Для знаходження екстремуму функції, візьмемо приватні похідні по a і b і прирівняємо їх до нуля.
Отримали систему з двох лінійних рівнянь. Розділимо обидва на 2n:
З першого рівняння висловимо невідому а:
і підставимо цей вираз у друге рівняння:
Побудувавши оцінки a і b коефіцієнтів і, ми можемо розрахувати т. н. передбачені raquo ;, або змодельовані значення? i=a + bxi та їх імовірнісні характеристики - середнє арифметичне і дисперсію.
Нескладно помітити, що виявилося. Так повинно бути завжди:
Крім того, обчислимо т. н. випадкові залишки і розрахуємо їх імовірнісні характеристики.
Виявилося,. Це також закономірно:...