яння регресії між двома ознаками
Знайти рівняння регресії - значить за емпіричними (фактичним) даними математично описати зміни взаємно корелюють величин.
Рівняння регресії має визначити, яким буде середнє значення результативної ознаки y при тому чи іншому значенні факторного ознаки x, якщо решта фактори, що впливають на y і не пов'язані з x, не враховувати, тобто абстрагуватися від них.
Кореляційний і регресійний аналізи тісно пов'язані між собою. Якщо кореляційний аналіз досліджує тісноту (силу) зв'язку, то регресійний аналіз є його логічним продовженням і досліджує форму, вид і параметри виявленої зв'язку.
Для аналітичної зв'язку між x і y можуть використовуватися наступні прості види рівнянь.
При лінійній формі зв'язку (рівняння прямої) рівняння регресії має вигляд:
(4)
де - теоретичний рівень результативної ознаки (читається як «ігрек, вирівняний по х»); - факторний ознака, фактичний рівень факторного ознаки;
а, b - параметри рівняння, які необхідно визначити.
Лінійна залежність - найбільш часто використовувана форма зв'язку між двома коррелирующими ознаками, і виражається вона при парної кореляції рівнянням прямої (4).
Гіпотеза про лінійної залежності між х і у висувається в тому випадку, якщо значення результативного і факторного ознак зростають (убувають) однаково, приблизно в арифметичній прогресії.
Параметри а і b відшукуються за МНК (методу найменших квадратів) у системі нормальних рівнянь МНК для лінійної регресії:
na + b? x =? в,
a? x + b? x? =? Ух. (5)
Для рішення системи (5) за емпіричними даними визначаємо число одиниць спостереження n, суму значень факторного ознаки? x, суму їх квадратів? x?, а також суму значень результативної ознаки? у і суму творів? ух.
Підставивши всі ці суми в систему нормальних рівнянь, знайдемо параметри шуканої прямий (лінійного рівняння регресії).
При цьому зазначені суми можна визначити двома способами:
за даними про значеннях х і у кожної одиниці сукупності (за списком);
по згрупованим даними, представленим у вигляді кореляційної чи іншої таблиці.
Розрахунок параметрів рівняння регресії за індивідуальними даними
Розглянемо розрахунок параметрів рівняння регресії між вартістю основних фондів х і валовим випуском продукції у.
Вихідні дані і розрахунок наведемо в табл. 2.
Пре д покладемо, що залежність між показниками х і у лінійна, тобто
Таблиця 2. Розрахункова таблиця для визначення параметрів рівняння регресії за індивідуальними даними
Основні фонди, млн руб. хВаловой випуск продукції, млн руб. ух 2 ху_у х=- 10,24 + + 2,12х12 16 25 38 43 55 60 80 91 10028 40 38 65 80 101 95 125 183 245144 256 625 1444 1849 3025 3600 6400 8281 10000336 640 950 2470 3440 5555 5700 10000 16653 2450015 24 43 70 81 106 117 159 183 +202? x=520? у=1000? x?=35624? ух=70244? у х=1000
Параметри а і b цього рівняння знайдемо, вирішивши систему нормальних рівнянь (5). Підставивши в неї необхідні суми, розраховані в табл. 2, отримаємо
a + 520b=1000,
a + 35624b=70244.
Вирішивши систему рівнянь, знайдемо, що а=- 10,24, b=2,12. Звідси шукане рівняння регресії у по х буде x=- 10,24 + 2,12 х.
Підставляючи в дане рівняння послідовно значення х (12, 16, 25 і т.д.), нахо д ним теоретичні (вирівняні) значення результативної ознаки , тобто yx, які показують, яким теоретично повинен бути середній обсяг валового випуску продукції при даній вартості основних фондів х i (за інших рівних умов для всіх підприємств). Теоретичні значення yx наведені в останній графі табл. 2 (з округленням до цілих).
Для знаходження а і b при лінійній залежності можуть бути запропоновані готові формули.
Так, на основі визначників 2-го порядку з системи нормальних рівнянь (5) отримаємо:
, (6)
або, розділивши кожне рівняння на n в системі нормальних рівнянь (12), і шляхом подальших перетворень одержимо:
(7)
або
(8)
отже,
У розглянутому прикладі знайдемо параметр b за формулою