96105001120947286193736897000058943885800
Х - капіталовкладення, Y - видобуток нафти
Рис.6. Поле кореляції
. Параметри рівняння регресії
Вибіркові середні.
Вибіркові дисперсії:
Середньоквадратичне відхилення
3.2 Коефіцієнт кореляції
Коваріація
Розраховуємо показник тісноти зв'язку. Таким показником є ??вибірковий лінійний коефіцієнт кореляції, який розраховується за формулою:
Лінійний коефіцієнт кореляції приймає значення від - 1 до +1.
Зв'язки між ознаками можуть бути слабкими і сильними (тісними). Їх критерії оцінюються за шкалою Чеддока:
.1 lt; rxy lt; 0.3: слабка;
.3 lt; rxy lt; 0.5: помірна;
.5 lt; rxy lt; 0.7: помітна;
.7 lt; rxy lt; 0.9: висока;
.9 lt; rxy lt; 1: вельми висока;
У нашому прикладі зв'язок між ознакою Y фактором X слабка і пряма.
Крім того, коефіцієнт лінійної парної кореляції може бути визначений через коефіцієнт регресії b:
3.3 Рівняння регресії (оцінка рівняння регресії)
Лінійне рівняння регресії має вигляд y=0.00625 x + 60447.34
коефіцієнтів рівняння лінійної регресії можна надати економічний сенс.
Коефіцієнт регресії b=0.00625 показує середня зміна результативного показника (в одиницях виміру у) з підвищенням або пониженням величини фактора х на одиницю його виміру. У даному прикладі зі збільшенням на 1 одиницю y підвищується в середньому на 0.00625.
Коефіцієнт a=60447.34 формально показує прогнозований рівень у, але тільки в тому випадку, якщо х=0 знаходиться близько з вибірковими значеннями.
Але якщо х=0 знаходиться далеко від вибіркових значень х, то буквальна інтерпретація може привести до невірних результатів, і навіть якщо лінія регресії досить точно описує значення спостережуваної вибірки, немає гарантій, що також буде при екстраполяції вліво або вправо.
Підставивши в рівняння регресії відповідні значення х, можна визначити вирівняні (передбачені) значення результативного показника y (x) для кожного спостереження.
Зв'язок між у і х визначає знак коефіцієнта регресії b (якщо gt; 0 - прямий зв'язок, інакше - зворотна). У нашому прикладі зв'язок пряма.
Помилка апроксимації.
Оскільки помилка менше 7%, то дане рівняння можна використовувати в якості регресії.
Емпіричне кореляційне відношення.
Де
Індекс кореляції.
Для лінійної регресії індекс кореляції рівний коефіцієнту кореляції rxy=0.0877.
Отримана величина свідчить про те, що фактор x не суттєво впливає на y
Для будь-якої форми залежності тіснота зв'язку визначається за допомогою множинного коефіцієнта кореляції:
Даний коефіцієнт є універсальним, так як відображає тісноту зв'язку і точність моделі, а також може використовуватися при будь-якій формі зв'язку змінних. При побудові однофакторной кореляційної моделі коефіцієнт множинної кореляції рівний коефіцієнту парної кореляції rxy.
На відміну від лінійного коефіцієнта кореляції він характеризує тісноту нелінійної зв'язку і не характеризує її напрямок. Змінюється в межах [0; 1].
Теоретичне кореляційне відношення для лінійного зв'язку дорівнює коефіцієнту кореляції rxy.
3.4 Коефіцієнт детермінації
=0.08772=0.00769
т.е. в 0.77% випадків зміни х призводять до зміни y. Іншими словами - точність підбору рівняння регресії - низька. Решта 99.23% зміни Y пояснюються чинниками, які не врахованими в моделі (а також помилками специфікації).
Для оцінки якості параметрів регресії побудуємо розрахункову таблицю (табл. 2)
xyy (x) (yi-ycp) 2 (yy (x)) 2 (xi-xcp) 2 | y - yx|:y372115400060680.084970250044623529.823497764335.610.12423685950060712.3424025001469768.532914369428.010.0204523616390060774.8481225009766603.631935287265.610.0489685166560060875.892070250022317231.7774893001.610.072881336450060998.591190250012259893.6367566756.010.0543963336170061049.88422500422661.82396.010.01051289035960061253.5921025002734364.641059509010.010.02771378615950061309.6224025003274728.631722922365.610.03041462586080061362.1462500316003.552490519006.010.009251655856140061483.031225006893.434793083670.410.001359635296105006105009794...