досліджень полягає в тому, що дуже часто необхідно вивчати і передбачати соціальні події. Друга частина даної глави буде присвячена регресії, метою якої є побудова моделей, що пророчать імовірність подій. Величина називається помилкою регресії. Перші математичні результати, пов'язані з регресійним аналізом, зроблені у припущенні, що регресійна помилка розподілена нормально з параметрами, помилка для різних об'єктів вважаються незалежними. Крім того, в даній моделі ми розглядаємо змінні як невипадкові значення. Таке, на практиці, виходить, коли йде активний експеримент, в якому задають значення (наприклад, призначили зарплату працівнику), а потім вимірюють (оцінили, якою стала продуктивність праці).
Для точного опису рівняння регресії необхідно знати умовний закон розподілу результативного показника у. У статистичній практиці таку інформацію отримати зазвичай не вдається, тому обмежуються пошуком підходящих апроксимацій для функції f (x1, x2, ..., хk), заснованих на вихідних статистичних даних.
У рамках окремих модельних припущень про тип розподілу вектора показників (У, x1, x2, ..., хk) може бути отриманий загальний вид рівняння регресії f (x) = M (y/x) x = (x1, x2, ..., хk). Наприклад, у реченні, що досліджувана сукупність показників підпорядковується (k + 1) - мерному нормальному закону розподілу з вектором математичних сподівань
M =,
де Mx =, My = MY
і ковариационной матрицею S =,
де syy = S2у = M (y-My);
S yx =; S xx =;
s ij = M (xi - Mxi); (xj - Mxj); sjj = sj = M (xj - Mxj). [12]
З цього випливає, що рівняння регресії (умовне математичне сподівання) має вид:
M (y/x) = My + (x - Mx). p> Таким чином, якщо багатовимірна випадкова величина (у, x1, x2, ..., хk) підпорядковується (k +1)-Мірному нормальному закону розподілу, то рівняння регресії результативного показника у по пояснює змінним x1, x2, ..., хk має лінійний по х вигляд. Метод включення і виключення змінних полягає в наступному. З безлічі факторів, що розглядаються дослідником як можливі аргументи регресійного рівняння, відбирається один, який найбільше пов'язаний кореляційною залежністю. Далі проводиться та ж процедура при двох обраних змінних, при трьох і т.д. Процедура повторюється до тих пір, поки в рівняння не будуть включені всі аргументи виділені дослідником, що задовольняють критеріям значимості включення. Зауваження: щоб уникнути зациклення процесу включення виключення значимість включення встановлюється менше значущості винятку. Змінні, породжувані регресійним рівнянням. Збереження змінних, породжуваних регресією, проводиться підкоманду. Завдяки отриманим оцінками коефіцієнтів рівняння регресії можуть бути оцінені прогнозні значення залежної змінної, причому вони можуть бути обчислені і там, де значення визначені, і там де вони не визначені.
Однак у статистичній практиці зазвичай доводиться обмежуватися пошуком підходящих апроксимацій для невід...