ідомо, лінійний коефіцієнт кореляції знаходиться в межах:
-1 ≤ r yt ≤ 1.
Слід мати на увазі, що величина лінійного коефіцієнта кореляції оцінює тісноту зв'язку розглянутих ознак у її лінійної формі. Тому близькість абсолютної величини лінійного коефіцієнта кореляції до нуля ще не означає відсутності зв'язку між ознаками. p> Для оцінки якості підбору лінійної функції розраховується квадрат лінійного коефіцієнта кореляції r yt 2 , званий коефіцієнтом детермінації . Коефіцієнт детермінації характеризує частку дисперсії результативної ознаки у t , пояснюється регресією, в загальній дисперсії результативної ознаки:
(1.6.3)
де
В
загальна дисперсія результативної ознаки у;
В
залишкова дисперсія, обумовлена, виходячи з рівняння регресії
у t = F (t). p> Відповідно величина 1 - r 2 характеризує частку дисперсії у, викликану впливом інших, не врахованих в моделі факторів.
Рівняння нелінійної регресії, так само як і в лінійній залежності, доповнюється показником кореляції, а саме індексом кореляції R:
(1.6.4)
Інакше, індекс кореляції можна виразити як
В
Величина даного показника знаходиться в межах:
0 ≤ R ≤ 1,
чим ближче до одиниці, тим тісніше зв'язок розглянутих ознак, тим більш надійно знайдене рівняння регресії.
Парабола другого порядку, як і поліном більш високого порядку, при ліанерізаціі приймає вид рівняння множинної регресії. Якщо ж нелінійне щодо пояснюють змінних рівняння регресії при лінеаризації приймає форму лінійного рівняння парної регресії, то для оцінки тісноти зв'язку може бути використаний лінійний коефіцієнт кореляції, величина якого в цьому випадку співпаде з індексом кореляції.
Інакше йде справа, коли перетворення рівняння в лінійну форму пов'язані з залежною змінною. У цьому випадку лінійний коефіцієнт кореляції по перетвореним значенням ознак дає лише наближену оцінку тісноти зв'язку і чисельно не співпадає з індексом кореляції. Так, для статечної функції у х = ах b після переходу до логарифмічно лінійним рівнянням lny = lna + blnx може бути знайдений лінійний коефіцієнт кореляції для фактичних значень змінних х і у, а для їх логарифмів, тобто r lnylnx . Відповідно квадрат його значення буде характеризувати ставлення факторної суми квадратів відхилень до загальної, але не для вида, а для його логарифмів:
.
Тим часом при розрахунку індексу кореляції використовуються суми квадратів відхилень ознаки у, а не їх логарифмів. З цією метою визначаються теоретичні значення результативної ознаки, тобто, як антилогарифмів розрахованої за рівнянням величини і залишкова сума квадратів як. Індекс кореляції визначається за формулою
В
У знаменнику розрахунку R 2 yx бере участь загальна сума квадратів відхилень фактичних значень у від їх середньої величини, а в розрахунку r 2 lnx lny бере участь. Відповідно розрізняються числители і знаменники розглянутих показників:
- в індексі кореляції і
- у коефіцієнті кореляції.
Внаслідок близькості результатів і простоти розрахунків з використанням комп'ютерних програм для характеристики тісноти зв'язку за нелінійним функціям широко використовується лінійний коефіцієнт кореляції. p> Незважаючи на близькість значень R і r або R і r в нелінійних функціях з перетворенням значення ознаки у, слід пам'ятати, що якщо при лінійної залежності ознак один і той же коефіцієнт кореляції характеризує регресію, як слід пам'ятати, що якщо при лінійній Залежно ознак один і той же коефіцієнт кореляції характеризує регресію як, так і, так як, то при криволінійної залежності для функції y = j (x) НЕ дорівнює для регресії x = f (y).
Оскільки у розрахунку індексу кореляції використовується співвідношення факторної і загальної суми квадратів відхилень, то має той же зміст, що і коефіцієнт детермінації. У спеціальних дослідженнях величину для нелінійних зв'язків називають індексом детермінації.
Оцінка суттєвості індексу кореляції проводиться, так само як і оцінка надійності коефіцієнта кореляції.
Індекс кореляції використовується для перевірки суттєвості в цілому рівняння нелінійної регресії за F-критерієм Фішера:
В
де - індекс детермінації;
n - число спостережень;
m - число параметрів при змінних х.
Величина m характеризує число ступенів свободи для факторної суми квадратів, а (n - m - 1) - число ступенів свободи для залишкової суми квадратів. p> Для статечної функції m = 1 і формула F - критерію прийме той же вигляд, що і при лінійної залежності:
В
Для параб...