методи - параметричні - їх прийнято називати кореляційними.
Тим часом в статистичній практиці доводиться стикатися з завданнями вимірювання зв'язку між якісними ознаками, до яких параметричні методи аналізу в їх звичайному вигляді незастосовні. Статистичної наукою розроблені методи, за допомогою яких можна виміряти зв'язок між явищами, не використовуючи при цьому кількісні значення ознаки, а значить, і параметри розподілу. Такі методи отримали назву непараметричних.
Якщо вивчається взаємозв'язок двох якісних ознак, то використовують комбінаційне розподіл одиниць сукупності у формі так званих таблиць взаємної спряженості.
Даний метод обробки статистичних даних вельми популярний в економіці і соціальних науках (зокрема в психології та соціології), хоча сфера застосування коефіцієнтів кореляції обширна: контроль якості промислової продукції, металознавство, агрохімія, гідробіологія, біометрія та інші. У різних прикладних галузях прийняті різні межі інтервалів для оцінки тісноти та значущості зв'язку.
Популярність методу обумовлена ??двома моментами: коефіцієнти кореляції відносно прості в підрахунку, їх застосування не вимагає спеціальної математичної підготовки. У поєднанні з простотою інтерпретації, простота застосування коефіцієнта призвела до його широкого поширення у сфері аналізу статистичних даних.
. Коефіцієнти асоціації і контингенции
Для вимірювання зв'язку між двома дихотомічними змінними (тобто ознаками, кожен з яких приймає два значення) дані представляються у вигляді таблиці спряженості 2 х 2 (її називають також четирехпольние таблицею). Наприклад, вивчається зв'язок між активністю роботи в профспілці і рівнем заробітної плати (таблиці 1).
Таблиця 1 - Активність у профспілці і рівень заробітної плати
Прояв актівностіУровень заробітної платиІтоговисокійнізкійВисокая45 (a) 5 (b) 50 (a + b) Нізкая15 (c) 35 (d) 50 (c + d) Ітого60 (a + c) 40 (b + d ) 100
У таблиці 1 показано, як розподілилися за категоріями 100 працівників, за якими були отримані дані про заробітну плату і роботі в профспілці. Очевидно, що ці змінні зв'язані: поява осіб з поєднанням високої активності (або неактивність) у профспілці і високим (низьким) рівнем заробітної плати не є рівноімовірною. Серед тих, хто активно працює в профспілці, ймовірність зустріти високооплачуваних працівників набагато вище, ніж серед тих, хто не відрізнявся активністю. Для таких таблиць розроблені спеціальні заходи зв'язків. До них відносяться коефіцієнт асоціації і коефіцієнт контингенции.
Коефіцієнт асоціації запропонований англійським статистиком Дж. Е. Юлом
Коефіцієнт асоціації приймає значення в інтервалі [0,1]: 0- відсутність зв'язку, 1 повна зв'язок. Обчислимо значення за даними табл. 1:
т.е. зв'язок між досліджуваними ознаками дуже тісна.
У разі відсутності зв'язку між активністю і заробітною платою ми б мали в кожній клітині табл. 1 по 25 чоловік, і тоді коефіцієнт асоціації дорівнював би: 0.
Міра зв'язку Юла заснована на порівнянні ймовірності появи взаємно сумісних і взаємно несумісних пар значень. Взаємно сумісними в нашому прикладі є: «висока активність - висока заробітна плата», «низька активність - низька заробітна плата»; взаємно несумісними є: «низька активність - висока заробітна плата», «висока активність - низька заробітна плата».
Коефіцієнт асоціації приймає значення «1», якщо хоча б одна з клітин таблиці 2 х 2 дорівнює нулю (таблиця 2 і таблиця 3).
Таблиця 2 - Випадок повного зв'язку. Активність у профспілці і рівень заробітної плати
Прояв актівностіУровень заробітної платиІтоговисокійнізкійВисокая - 50 (b) 50 (a + b) Нізкая50 (c) - 50 (c + d) Ітого50 (a + c) 50 (b + d) 100
Таблиця 3 - Випадок неповної зв'язку. Активність у профспілці і рівень заробітної плати
Прояв актівностіУровень заробітної платиІтоговисокійнізкійВисокая25 (a) - 25 (a + b) Нізкая30 (c) 45 (d) 75 (c + d) Ітого55 (a + c) 45 (b + d) 100
Для таблиці 2:=- 1, випадок повної зв'язку.
Для таблиці 3:=1, у разі неповної зв'язку.
Ця особливість коефіцієнта асоціації знижує його значення і показує, наскільки важливо дотримуватися обережності при інтерпретації результатів вимірювання зв'язку.
Більш достовірне вимір зв'язку забезпечує коефіцієнт контингенции:
Таблиця 4 - Порівняльна таблиця коефіцієнтів асоціації та контингенции
Номер табліциКоеффіціент ассоціацііКоеффіціент контінгенціі10,9090,6122-1-1310,52
...