;,
де - приватні середні;
- загальна середня;
- підсумки за ознакою;
- підсумки за ознакою;
- число спостережень. br/>
Те ж співвідношення зберігається і для умовних значень, отриманих числовим перетворенням.
Саме відношення дисперсій (подкоренное вираз) називається коефіцієнтом детермінації (воно дорівнює також квадрату емпіричного кореляційного відносини). Емпіричне кореляційне відношення змінюється в широких межах (від 0 до 1). Якщо воно дорівнює нулю, значить факторний ознака на кореляційний не впливає. Якщо = 1, значить, результативний ознака повністю залежить від факторного. Якщо ж емпіричне кореляційне відношення являє дріб, близьку одиниці, то говорять про тісний зв'язок між факторною та результативною ознаками. Якщо ця дріб мала (близька нулю), то говорять про слабку зв'язку між ними.
Коефіцієнт лінійної кореляції і індекс кореляції.
Мірою тісноти зв'язку між двома статистично пов'язаними ознаками служить коефіцієнт лінійної кореляції або просто коефіцієнт кореляції. Він має той же зміст, що й емпіричне кореляційне відношення, але може приймати як позитивне, так і негативне значення. Коефіцієнт кореляції має суворе математичне вираз для лінійного зв'язку. Позитивне значення буде вказувати на прямий зв'язок між ознаками, негативне - на зворотну.
Парний коефіцієнт кореляції в випадку лінійної форми зв'язку обчислюють за формулою
,
а його вибіркове значення - по формулою:
В
При малому числі спостережень вибірковий коефіцієнт кореляції зручно обчислювати за такою формулою:
В
Величина коефіцієнта кореляції змінюється в інтервалі.
При між двома змінними існує функціональний зв'язок, при - пряма функціональна зв'язок. Якщо, то значення Х і У в вибірці некорреліровани; в разі, якщо система випадкових величин має двовимірне нормальний розподіл, то величини Х і У будуть і незалежними.
Якщо коефіцієнт кореляції знаходиться в інтервалі, то між величинами Х і У існує зворотній кореляційний зв'язок. Це знаходить підтвердження і при візуальному аналізі вихідної інформації. У цьому випадку відхилення величини У від середнього значення взяті з протилежним знаком.
Якщо кожна пара значень величин Х і У найчастіше одночасно виявляється вище (нижче) відповідних середніх значень, то між величинами існує прямий кореляційний зв'язок і коефіцієнт кореляції знаходиться в інтервалі.
Якщо ж відхилення величини Х від середнього значення однаково часто викликають відхилення величини У вниз від середнього значення і при цьому відхилення виявляються весь час різними, то можна припускати, що значення коефіцієнта кореляції прагне до нуля.
Слід зазначити, що значення коефіцієнта кореляції не залежить від одиниць виміру і вибору початку відліку. Це означає, що якщо змінні Х і У зменшити (збільшити) в ...