ореляція показує, який зв'язок існує між двома величинами, в нашому випадку негативний зв'язок.
У завданні 1.102. мається наступні дані про ціну на нафту х (ден.ед.) і індексі акцій нафтових компаній у (ум.од.). Припускаючи, що між змінними х і у існує лінійна залежність, знайти коефіцієнт кореляції.
Таблиця 3.9
х17,517,317,1517,117,417,45у510518535530545535
Таблиця 3.10
Cov (x, y) - КоваріаціяVar (X) - дісперсіяVar (Y) - дісперсіяКорреляція - 0,39722135,13890,022222-0,22922 Коваріація Х і У показує залежність випадкових величин, залежність випадкових величин дорівнює - 0,39722.
Дисперсія (варіація) показує на скільки відхиляється кожне значення від загальної середньої.
Кореляція показує, який зв'язок існує між двома величинами, в нашому випадку негативний зв'язок.
. Парний регресійний аналіз. Лінійні моделі
Метод найменших квадратів невідомі параметри bo і Ь 1 вибираються таким чином, щоб сума квадратів відхилень емпіричних значень yi від значень у (sh), знайдених по рівнянню регресії, була мінімальною:
Слід зазначити, що для оцінки параметрів b 0 і Ь 1 можливі й інші підходи. Так, наприклад, згідно з методом найменших модулів слід мінімізувати суму абсолютних величин відхилень
Однак метод найменших квадратів істотно простіше при проведенні обчислювальної процедури і дає, як ми побачимо далі, хороші по статистичних властивостях оцінки. Цим і пояснюється його широке застосування в статистичному аналізі. На підставі необхідної умови екстремуму функції двох змінних S=S (b 0, b 1) прирівнюємо до нуля її частинні похідні, тобто
Звідки після перетворень отримаємо систему нормальних рівнянь для визначення параметрів лінійної регресії:
Тепер, розділивши обидві частини рівнянь на n, отримаємо систему нормальних рівнянь у вигляді:
де b 1 дорівнює:
а b 0 дорівнює:
Величина r є показником тісноти зв'язку і називається вибірковим коефіцієнтом кореляції (або просто коефіцієнтом кореляції).
Властивості коефіцієнта кореляції:
. Коефіцієнт кореляції приймає значення на відрізку [- 1; 1], тобто- 1 lt; г lt; 1. Чим ближче г до одиниці, тим тісніше зв'язок.
. При r=± 1 кореляційний зв'язок являє лінійну функціональну залежність. При цьому всі спостережувані значення Розташовуються на прямій лінії.
. При r=0 лінійна кореляційний зв'язок відсутній. При цьому лінія регресії паралельна осі Ох.
Основні передумови регресійного аналізу:
. У моделі yi=b 0 + b 1 xi + е i обурення (або залежна змінна yi) є величина випадкова, а пояснює змінна x-величина невипадкова.
. Математичне сподівання обурення дорівнює нулю: M {е i)=0 (або математичне очікування залежної змінної yi) одно лінійної функції регресії: M (yi)=b 0 + b 1 xi
. Дисперсія обурення (або залежною змінною yi) постійна для любогоi: D (е i)=у 2 (або D (yi)=у 2 -умова гомоскедастичність або дорівнює мінливості обурення (залежною змінною).
. Збурення е i і е j (або змінні yi і yj) НЕ корельовані M (е i, е j)=0 (i? J).
. Обурення е i (або залежна змінна у i) є нормально розподілена випадкова величина.
У завданні 1.18 досліджується залежність продуктивності праці y (т/год) від рівня механізації робіт x 1 (%) за даними 15 промислових підприємств.
Таблиця 4.1
x153151612125151411769319y - 50-7-10-5-5-1-6-31-7-4-10-8
Таблиця 4.2
b1b0-0,50629721,401343409
?=1,4-0,5 * x
Даний показує, що при збільшенні механізації робіт на 1%, вона снижется на 0,5 разів.
У завданні 1.39 мається наступні дані про ціну на нафту х (ден.ед.) і індексі акцій нафтових компаній у (ум.од.).
Таблиця 4.3
х17,517,317,217,117,417,5у520528535540545555
Таблиця 4.4
b1b0-1,625565,30625
Даний показує, що при збільшенні ціни на нафту на 1%, вона снижется на 1,625 разів.
У завданні 1.60. мається наступні дані про ціну на нафту х (ден.ед.) і індексі акцій нафтових компаній у (ум.од.). Припускаючи, що між змінними х і у існу...