змінними. Нехай вихідними даними є набір випадкових векторів Вибірковим коефіцієнтом кореляції, більш детально, вибірковим лінійним парним коефіцієнтом кореляції К. Пірсона, як відомо, називається число
(2)
Якщо r n =1, то причому a gt; 0. Якщо ж r n =- 1, то причому a lt; 0. Таким чином, близькість коефіцієнта кореляції до 1 (за абсолютною величиною) говорить про досить тісному лінійного зв'язку. [4]
Виявити наявність або відсутність кореляції між двома величинами можна шляхом візуального аналізу полів кореляції і оцінкою величини вибіркового коефіцієнта кореляції.
Для незалежних випадкових величин коефіцієнт кореляції дорівнює нулю, але він може бути дорівнює нулю для деяких залежних величин, які при цьому називаються некоррелірованнимі. Коефіцієнт кореляції характеризує не всяку залежність, а тільки лінійну. Якщо випадкові величини x і y пов'язані точної функціональної лінійною залежністю, то. У загальному випадку, коли величини пов'язані довільної стохастичною залежністю, коефіцієнт кореляції може мати значення в межах.
1.5 Регресійний аналіз
Регресійний аналіз - це статистичний метод дослідження залежності випадкової величини у від змінних (аргументів) х < i align="justify"> j (j= 1, 2, ..., k), розглянутих в регресійному аналізі як невипадкові величини незалежно від істинного закону розподілу x j .
Звичайно передбачається, що випадкова величина у має нормальний закон розподілу з умовним математичним очікуванням =? ( x 1 , ..., < i> х k ), є функцією від аргументів х j і з постійною, не залежної від аргументів дисперсією? 2.
Для проведення регресійного аналізу з (k + 1) -мірною генеральної сукупності ( у, x 1 , х 2 , ..., х j , ..., х k ) береться вибірка обсягом n, і кожне i -е спостереження (об'єкт) характеризується значеннями змінних (у i , x i1 , х i2 , ..., х ij , ..., x ik ), де х ij - значення j -й змінної для i -го спостереження ( i =1, 2, ..., n), у i - значення результативної ознаки для i -го спостереження.
Найбільш часто використовувана множинна лінійна модель регресійного аналізу має вигляд
(3)
де? j - параметри регресійної моделі;
? j - випадкові помилки спостереження, що не залежні один від одного, мають нульову середню і дисперсію? 2.
Відзначимо, що модель (3) справедлива для всіх i =1,2, ..., n, линейна щодо невідомих параметрів ? 0 ,? 1 , ...,? j , ... ,? k і аргументів.
Як випливає з (3) коефіцієнт регресії Bj показує, на яку величину в середньому зміниться результативний ознака у, якщо змінну хj збільшити на одиницю виміру, тобто є нормативним коефіцієнтом.
У матричній формі регресійна модель має вигляд
(4)
де Y - випадковий вектор-стовпець розмірності п х 1 спостережуваних значень результативної ознаки (у 1 , у 2 , .... у n ); Х - матриця розмірності п х (k + 1) спостережуваних значень аргументів, елемент матриці х ,, розглядається як невипадкова величина ( i =1, 2, ..., n; j= 0,1 , ..., k; x 0i , =1);? - вектор-стовпець розмірності (k + 1) х 1 невідомих, що підлягають оцінці параметрів моделі (коефіцієнтів регресії);? - випадковий вектор-стовпець розмірності п х 1 помилок спостережень (залишків). Компоненти вектора? i незалежні один від одного, мають нормальний закон розподілу...