Саме тому часто говорять про лінійної кореляції при використанні такого способу оцінки зв'язку між випадковими величинами. В окремих випадках доводиться вирішувати питання про зв'язки декількох (більше 2) випадкових величин або питання про множинної кореляції. Можна знайти парні коефіцієнти кореляції R xy, R xz, R yz за наведеною вище формулою. У випадках множинного кореляційного аналізу іноді потрібно відшукувати т. Н. приватні коефіцієнти кореляції - наприклад, оцінка виляння Z на зв'язок між X і Y проводиться за допомогою коефіцієнта
R xy.z=
І, нарешті, зв'язок між даною випадковою величиною і сукупністю інших визначають коефіцієнти множинної кореляції R x.yz, R y.zx, R z.xy, формули для обчислення яких побудовані за тими ж принципами - обліку зв'язку однієї з величин з усіма іншими в сукупності.
2.2.2 Лінійна регресія
У тих випадках, коли з природи процесів в моделі або з даних спостережень над нею випливає висновок про нормальному законі розподілу двох випадкових велечин - Y і X, з яких одна є незалежною, т. е. Y є функцією X, то виникає спокуса визначити таку залежність формально raquo ;, аналітично.
У разі успіху буде набагато простіше вести моделювання. Звичайно, найбільш привабливою є перспектива лінійної залежності типу
=a + b · X.
Подібна задача носить назву завдання регресійного аналізу.
Вивчення зв'язку між трьома і більше пов'язаними між собою ознаками носить назву множинної (багатофакторної) регресії. При дослідженні залежностей методами множинної регресії завдання формулюється так само, як і при використанні парної регресії. Побудова моделей множинної регресії включає кілька етапів:
вибір форми зв'язку (рівняння регресії):
відбір факторних ознак:
забезпечення достатнього обсягу сукупності для отримання незміщене оцінок.
Найбільш прийнятним способом визначення виду вихідного рівняння регресії є метод перебору різних рівнянь.
Сутність даного методу полягає в тому, що велика кількість рівнянь (моделей) регресії, відібраних для опису зв'язків будь-якого соціально-економічного явища або процесу, реалізується на ЕОМ за допомогою спеціально розробленого алгоритму перебору з подальшою статистичною перевіркою, головним чином на основі t-крнтерія Стьюдeнта і F-критерію Фішера. Спосіб перебору є досить трудомістким і пов'язаний з великим обсягом обчислювальних робіт. Практика побудови багатофакторних моделей взаємозв'язку показує, що все реально існуючі залежності між соціально-економічними явищами можна описати, використовуючи п'ять типів моделей:
лінійна: Y=A 0 + A 1 X 1 + ... .A k X k
статечна
показова
параболічна
гіперболічна
Основне значення мають лінійні моделі в силу простоти і логічності їх економічної інтерпретації. Нелінійні форми залежності приводяться до лінійним шляхом лінеаризації.
Важливим етапом побудови вже обраного рівняння множинної регресії є відбір і подальше включення факторних ознак. Складність формування рівняння множинної регресії полягає в тому, що майже всі факторні ознаки знаходяться в залежності один від одного. Проблема розмірності моделі зв'язку, т. Е. Визначення оптимального числа факторних ознак, є однією з основних проблем побудови множинного рівняння регресії. З одного боку, чим більше факторних ознак включено в рівняння, тим воно краще описує явище. Однак модель розмірністю 100 і більше факторних ознак складно реалізовується і вимагає великих витрат машинного часу. Скорочення розмірності моделі за рахунок виключення другорядних, економічно і статистично несуттєвих факторів сприяє простоті і якості її реалізації. У той же час побудова моделі регресії малої розмірності може призвести до того, що така модель буде недостатньо адекватна досліджуваних явищ і процесам. Проблема відбору факторних ознак для побудови моделей взаємозв'язку може бути вирішена на основі евристичних або багатовимірних статистичних методів аналізу.
Найбільш прийнятним способом відбору факторних ознак є крокова регресія (кроковий регресійний аналіз). Суть методу крокової регресії полягає в послідовному включенні факторів в рівняння регресії і подальшій перевірці їх значущості. Фактори почергово вводяться в рівняння так званим прямим методом raquo ;. При перевірці значущості введеного фактора визначається, наскільки зменшується сума квадратів залишків і збільшується величина множинного коефіцієнта кореляції. одночасно використовується і зворотний метод, тобто виключення факторів, що стали незначущими на основі t-критерію Стьюдента. Фактор є незначущи...