Завдання 1
Досліджується залежність продуктивності праці (Y i) від рівня механізації робіт (X i) за даними 14 промислових підприємств (i- порядковий номер підприємства). Статистичні дані наведені в таблиці. Потрібно:
) Знайти оцінки параметрів лінійної регресії у на х. Побудувати діаграму розсіювання і нанести пряму регресії на діаграму розсіювання.
) На рівні значущості а=0,05 перевірити гіпотезу про згоду лінійної регресії з результатами спостережень.
) З надійністю p=0,95 знайти довірчі інтервали для параметрів лінійної регресії. 1.1.
Таблиця
i234567891011121314Xi г3230364041475654605561676976Yi2024283031333437384041434548
Рішення:
Метод найменших квадратів дає найкращі (заможні, ефективні та незміщені) оцінки параметрів рівняння регресії. Але тільки в тому випадку, якщо виконуються певні передумови щодо випадкового члена (?) І незалежної змінної (x).
Формально критерій МНК можна записати так:
=? (y i - y * i) 2? min
Система нормальних рівнянь.
an + b? x =? y? x + b? x 2 =? yx
Для наших даних система рівнянь має вигляд
a + 724 b=492
a + 40134 b=26907
Домножим рівняння (1) системи на (- 51.71), одержимо систему, яку вирішимо методом алгебраїчного додавання.
- 724a - 37438.04 b=- 25441.32
a + 40134 b=26907
Отримуємо:
. 96 b=1465.68
Звідки b=0.5435
Тепер знайдемо коефіцієнт «a» з рівняння (1):
a + 724 b=492
a + 724 0.5435=492
a=98.51=7.0361
Отримуємо емпіричні коефіцієнти регресії: b=0.5435, a=7.0361
Рівняння регресії (емпіричне рівняння регресії):=0.5435 x + 7.0361
Таблиця. Для розрахунку параметрів регресії побудуємо розрахункову таблицю
xyx 2 y 2 x y322010244006403024900576720362812967841008403016009001200413116819611271473322091089155156343136115619045437291613691998603836001444228055403025160022006141372116812501674344891849288169454761202531057648577623043648724492401341813826907
. Параметри рівняння регресії
Вибіркові середні.
Вибіркові дисперсії:
Середньоквадратичне відхилення
Коефіцієнт кореляції b можна знаходити за формулою, не вирішуючи систему безпосередньо:
Коефіцієнт кореляції
Розраховуємо показник тісноти зв'язку. Таким показником є ??вибірковий лінійний коефіцієнт кореляції, який розраховується за формулою:
Лінійний коефіцієнт кореляції приймає значення від - 1 до +1.
Зв'язки між ознаками можуть бути слабкими і сильними (тісними). Їх критерії оцінюються за шкалою Чеддока:
.1 lt; rxy lt; 0.3: слабка;
.3 lt; rxy lt; 0.5: помірна;
.5 lt; rxy lt; 0.7: помітна;
.7 lt; rxy lt; 0.9: висока;
.9 lt; rxy lt; 1: вельми висока;
У нашому прикладі зв'язок між ознакою Y фактором X вельми висока і пряма. Крім того, коефіцієнт лінійної парної кореляції може бути визначений через коефіцієнт регресії b:
Рівняння регресії (оцінка рівняння регресії).
Лінійне рівняння регресії має вигляд y=0.54 x + 7.04
коефіцієнтів рівняння лінійної регресії можна надати економічний сенс.
Коефіцієнт регресії b=0.54 показує середня зміна результативного показника (в одиницях виміру у) з підвищенням або пониженням величини фактора х на одиницю його виміру. У даному прикладі зі збільшенням на 1 одиницю y підвищується в середньому на 0.54.
Коефіцієнт a=7.04 формально показує прогнозований рівень у, але тільки в тому випадку, якщо х=0 знаходиться близько з вибірковими значеннями.
Але якщо х=0 знаходиться далеко від вибіркових значень х, то буквальна інтерпретація може привести до невірних результатів, і навіть якщо лінія регресії досить точно описує значення спостережуваної вибірки, немає гарантій, що також буде при екстраполяції вліво або вправо.
Підставивши в рівняння регресії відповідні значення х, можна визначити вирівняні (передбачені) значення результативного показника y (x) для кожного спо...