Теоретична частина.
Багатомірний кореляційний аналіз
В
У багатовимірної моделі кореляційного аналізу (З чотирма і більше змінними) обчислення приватних і множинних коефіцієнтів кореляції грунтується на використанні матриці коефіцієнтів парної кореляції.
Порядок приватного коефіцієнта кореляції визначається кількістю фіксованих змінних. Вибірковий приватний коефіцієнт кореляції будь-якого порядку можна визначити за формулою
В В
Це вираз передбачає обчислення великого числа вибіркових приватних коефіцієнтів кореляції від нульового до ( до -3)-го порядку, що є досить трудомісткою операцією.
Більш зручним є обчислення приватних коефіцієнтів кореляції за наступною схемою.
На основі матриці вибіркових коефіцієнтів парної кореляції
(1)
В
де Q - симетрична позитивно певна матриця, маємо
(2)
В
(3)
В
і так далі, де
Dij - визначник матриці, утвореної з матриці (1) викреслюванням i-го рядка і j-го стовпця для кожного визначника відповідно.
Для перевірки значимості приватного коефіцієнта кореляції використовується величина t, що має t-розподіл Стьюдента з числом ступенів свободи = n-l-2:
, (4)
де n - число спостережень;
l - число фіксованих змінних;
r част - відповідний вибірковий приватний коефіцієнт кореляції.
За допомогою таблиці розподілу Стьюдента за рівнем значущості a і = nl-2 знаходиться t кр . При t н > t кр гіпотеза Але: r част = 0 відхиляється. p> Довірчий інтервал для приватних коефіцієнтів кореляції будується за допомогою z-перетворення Фішера
, аналогічно розглянутим раніше випадкам.
Для визначення тісноти зв'язку між залежною змінної і сукупністю пояснюють змінних використовується вибірковий коефіцієнт множинної кореляції, що визначається за формулою
, (5)
де D - визначник матриці вибіркових коефіцієнтів кореляції;
Dii - алгеброіческое додаток до елемента r ii .
Для перевірки значимості коефіцієнта множинної кореляції використовується величина
, (6)
що має F-розподіл з 1 = l і = nl-2 ступенями свободи.
багатокрокового регресійний аналіз.
Очевидно, що просте поверхневе вивчення даних не дозволяє виявити, які фактори, розглянуті на стадії статистичного аналізу вихідної інформації, є суттєвими, а які - немає. Може статися, що нібито відсутня кореляція з даним фактором виявляється після того, як зв'язок з іншим фактором вже виключена.
...