ає визначати їх стан і прогнозувати розвиток. Нарешті, дані факторного аналізу дають підстави для ідентифікації об'єкта, тобто рішення завдання розпізнавання образу.
Методи факторного аналізу мають властивості, вельми привабливими для їх використання в складі інших статистичних методів, найбільш часто в кореляційно-регресійному аналізі, кластерному аналізі, багатовимірному шкалировании та ін/18 /.
3.3 Парна регресія. Імовірнісна природа регресійних моделей.
Якщо розглянути задачу аналізу витрат на харчування в групах з однаковими доходами, наприклад в $ 10.000 (x), то це детермінована величина. А ось Y - частка цих грошей, витрачається на харчування - випадкова і може змінюватися від року до року. Тому для кожного i-го індивіда:
В
де Оµ i - випадкова помилка;
О± і ОІ - константи (Теоретично), хоча можуть мінятися від моделі до моделі. p> Передумови для парної регресії:
- X і Y пов'язані лінійно;
- Х - невипадкова змінна з фіксованими значеннями;
- Оµ - помилки нормально розподілені N (0, Пѓ 2 );
-;
-.
На малюнку 3.1 представлена ​​модель парної регресії.
В
Малюнок 3.1 - Модель парної регресії
Ці передумови описують класичну лінійну регресійну модель.
Якщо помилка має ненульове середнє, вихідна модель буде еквівалентна нової моделі та іншим вільним членом, але з нульовим середнім для помилки.
Якщо виконуються передумови, то МНК оцінки і є ефективними лінійними незміщеними оцінками
В
Якщо позначити:
В
те що математичне сподівання і дисперсії коефіцієнтів і будуть наступні:
В
В
В
В
Ковариация коефіцієнтів:
В
Якщо те і розподілені теж нормально:
В
В
В
Звідси випливає, що:
- Варіація ОІ повністю визначається варіацією Оµ;
- Чим вище дисперсія X - тим краще оцінка ОІ. br/>
Повна дисперсія визначається за формулою:
В
Дисперсія відхилень у такому вигляді - незміщена оцінка і називається стандартною помилкою регресії. N-2 - може бути інтерпретовано як число ступенів свободи.
Аналіз відхилень від лінії регресії може уявити корисну міру того, наскільки оцінена регресія відображає реальні дані. Хороша регресія та, яка пояснює значну частку дисперсії Y і навпаки погана регресія не відслідковує більшу частину коливань вихідних даних. Інтуїтивно ясно, що всяка додаткова інформація дозволить поліпшити модель, тобто зменшити непоясненим частку варіації Y. Для аналізу регресійній моделі проводять розкладання дисперсії на складові, визначають коефіцієнт детермінації R 2 . p> Відношення двох дисперсій розподілено за F-розподілу, тобто якщо перевірити на статистичну значущість відмінності дисперсії моделі від дисперсії залишків, можна зробити висновок про значущість R ...