ці використання ковариации незручно, оскільки вона залежить від одиниць виміру випадкових величин x і y .
Для того, щоб мати справу з безрозмірним показником відхилення випадкових величин від своїх середніх, ковариация нормується на стандартні (середньоквадратичні відхилення). Замість коваріації у вигляді береться математичне очікування нормованих величин і, де (3.3)
. 2 Коефіцієнт парної лінійної кореляції (Пірсона)
Коефіцієнт кореляції двох змінних, виміряних в інтервальної шкалою називається коефіцієнтом кореляції Пірсона, а також лінійної кореляцією, оскільки відображає ступінь лінійного зв'язку між змінними. Цей коефіцієнт є ковариацию нормованих величин:
(3.4)
Оскільки величина має дискретне рівномірний розподіл, то її математичне сподівання дорівнює середньому арифметичному всіх прийнятих значень. Враховуючи це, коефіцієнт кореляції може бути представлений як:
(3.5)
. Коефіцієнт кореляції незалежних випадкових величин x і y дорівнює нулю, так як в цьому випадку.
Випадкові величини, для яких ковариация, і, отже, коефіцієнт кореляції дорівнюють нулю, називають лінійно некоррелірованнимі (лінійно не пов'язаними). ??
Іншими словами, якщо випадкові величини незалежні, то завжди, проте зворотне взагалі кажучи невірно - з рівності коефіцієнта кореляції нулю не слід незалежність випадкових величин. Можна говорити лише про відсутність між ними лінійного зв'язку. У цьому легко переконатися на прикладі:
Нехай змінні зв'язані функціональною залежністю, графік якої наведено на рис. 3. ([3]) Ми бачимо, що.
Внаслідок симетрії кожному відхиленню від осі абсцис від середнього зі знаком плюс відповідає таке ж відхилення зі знаком мінус з одними і тими ж відхиленнями від середнього ординат, тому математичне очікування змішаних творів у формулах коваріації і коефіцієнта кореляції дорівнює нулю. Отже,, хоча змінні зв'язані функціональною залежністю.
. Коефіцієнт кореляції лінійно пов'язаних випадкових величин x і y відрізняється від нуля, але знаходиться в деяких межах.
Існування меж значень коефіцієнта кореляції випливає з дисперсії суми залежних випадкових величин
(3.6)
Дисперсія завжди позитивна, значить
З виразу для коефіцієнта кореляції випливає, що. З урахуванням цього з рівності (3.6) після спрощень можна отримати нерівність або
Як було показано для коваріації, її знак, і, стало бути, знак вказує:
· знак плюс - на зростання лінійної стохастичної залежності
· знак мінус - на спадання лінійної стохастичної залежності.
Самі граничні значення відповідають виродження лінійної стохастичної залежності у функціональну. Очевидно, відповідає лінійно зростаючої функціональної залежності з кутовим коефіцієнтом a gt; 0, - лінійно спадної функціональної залежності з кутовим коефіцієнтом a lt; 0.
.3 Інтерпретація лінійної кореляції
Лінійну стохастичний зв'язок можна вважати реальною, якщо абсолютна величина коефіцієнта кореляції в 2-3 рази перевищує стандартне відхилення оцінки коефіцієнта. Невиконання даної умови вказує на відсутність лінійного зв'язку, однак не виключає лінійної стохастичної залежності тих же змінних.
Значна абсолютна величина коефіцієнта кореляції, в 2-3 рази перевищує стандартне відхилення оцінки коефіцієнта, свідчить про значимому прояві лінійної складової стохастичною зв'язку, однак не виключає більш тісної нелінійної стохастичної залежності.
Стохастическая зв'язок (лінійна або нелінійна), якщо вона реальна, сама по собі не вказує на причинно-наслідковий зв'язок змінних, навіть при надійному пророкуванні однієї змінної за значеннями іншої. Тут потрібні додаткові підстави для з'ясування, який з ознак є причиною іншого.
Внаслідок цього, кореляційні залежності приято поділяти на дійсні (істинні) та уявні (помилкові).
Дійсні кореляційні зв'язки відображають причинні відносини між залежною і незалежною змінними, при цьому розрізняються причинності:
· безпосередні, наприклад, залежно Z - числа міжміських телефонних переговорів від X - кількості АТС, тобто;
· через проміжні змінні (одну або декілька) - у прикладі вище це може бути число телефонів Y в АТС.
Помилкові кореляційні залежності можуть виникати між змінними, що не знаходяться між собою в причинно-наслідкового зв'язку.
. 4 Розрахунок коефіцієнта кореляції
Коефіцієнт кореляції часто розраховується за наведеною вище формулою:
(3.7)
Дане вираз можна перетворити алгебраїчно, в результаті чого воно...