овання по кожній змінній. Припускаючи довжини інтервалів угруповання (по кожній змінній) рівними між собою, вибирають центри (відповідно) цих інтервалів і числа в якості основи для розрахунків.
Коефіцієнт кореляції є мірою лінійного зв'язку між залежними випадковими величинами: він показує, наскільки добре в середньому може бути представлена ??одна з величин у вигляді лінійної функції одної.
Коефіцієнт кореляції обчислюється за формулою:
, (2.3.1)
де, і? середнє арифметичне значення відповідно по x і y.
Коефіцієнт кореляції між випадковими величинами за абсолютною величиною не перевищує 1. Чим ближче до 1, тим тісніше лінійна зв'язок між x і y.
У разі нелінійної кореляційної зв'язку умовні середні значення розташовуються близько кривої лінії. У цьому випадку в якості характеристики сили зв'язку рекомендується використовувати кореляційне відношення, інтерпретація якого не залежить від виду досліджуваної залежності.
Кореляційне відношення обчислюється за формулою:
, (2.3.2)
де, а чисельник характеризує розсіювання умовних середніх близько безумовного середнього.
Завжди. Рівність відповідає некоррелірованнимі випадковим величинам; тоді і тільки тоді, коли є точна функціональна зв'язок між y і x. У разі лінійної залежності y від x кореляційне відношення збігається з квадратом коефіцієнта кореляції. Величина використовується як індикатор відхилення регресії від лінійної.
Кореляційне відношення є мірою кореляційної зв'язку y з x в будь-якій формі, але не може дати уявлення про ступінь наближеності емпіричних даних до спеціальної формі. Щоб з'ясувати наскільки точно побудована крива відображає емпіричні дані, вводиться ще одна характеристика? коефіцієнт детермінованості.
Для його опису розглянемо такі величини.- Повна сума квадратів, де середнє значення.
Можна довести наступне рівність
.
Перший доданок одно і називається залишковою сумою квадратів. Воно характеризує відхилення експериментальних даних від теоретичних.
Друге доданок дорівнює і називається регресійної сумою квадратів, і воно характеризує розкид даних.
Очевидно, що справедливо наступне рівність.
Коефіцієнт детермінованості визначається за формулою:
. (2.3.3)
Чим менше залишкова сума квадратів в порівнянні з загальною сумою квадратів, тим більше значення коефіцієнта детермінованості, який показує, наскільки добре рівняння, отримане за допомогою регресійного аналізу, пояснює взаємозв'язку між змінними. Якщо він дорівнює 1, то має місце повна кореляція з моделлю, тобто нема різниці між фактичним і оцінним значеннями y. У протилежному випадку, якщо коефіцієнт детермінованості дорівнює 0, то рівняння регресії невдало для передбачення значень y.
Коефіцієнт детермінованості завжди не перевищує кореляційне відношення. У випадку, коли виконується рівність то можна вважати, що побудована емпірична формула найбільш точно відображає емпіричні дані.
3. Розрахунок коефіцієнтів апроксимації в Microsoft Excel
Функція y=f (x) задана таблично
Вихідні дані представлені в Таблиці 1.1.
Варіант №5
Таблиця 1. Вихідні дані
аргумент функція
аргумент
функція
аргумент
функція
аргумент
функція
аргумент
функція
0,770,562,767,065,5428,768,1265,8711.89130,751,452,083,4514,985,8130,768,8777,8512,56149,561,763,043,8915,986,9845,769,4586,0913,43172,452,232,764,8723,227,3450,8710,87101,6513,55175,512,653,655,0426,127.8660,4511,23124,3714,76200,54
Потрібно з'ясувати - яка з функцій - лінійна, квадратична або експоненціальна щонайкраще апроксимує функцію задану таблицею 1.
3.1 Апроксимація функції y=f (х) многочленом першого ступеня
Оскільки в завданні кожна пара значень (,) зустрічається один раз, то кореляційна таблиця прийме вигляд одиничної матриці. Значить умовні середні збігаються зі значеннями. Звідси випливає, що кореляційне відношення дорівнює 1 і, отже, між і існує функціональна залежність.
Для проведення розрахунків використовуємо кошти табличного процесора Microsoft Excel.
Таблиця 2
Пояснимо, як таблиця 2 складається.
Крок 1. У комірки B4: B28 заносимо значення.
Крок 2. У комірки C1: C28 заносимо значення.
Крок 3. У осередок D4 вводимо формулу=B4 ^ 2.
Крок 4. У комірки D5: D28 ця формула копіюється.
Крок 5. У осередок E4 вводимо формулу=B4 * C4.
Крок 6. У комірки E5: E28 ця формула копіюється.
Крок 7. У осередок F4 вводимо формулу=B4 ^...