span align="justify"> ой головної компоненти на j-ої змінної; f i? - значення ? - ї головної компоненти для i-го спостереження (об'єкта), де < span align = "justify">? = 1,2, ..., k.
За наявності результативного показника Y може бути побудовано рівняння регресії на головних компонентах. p align="justify"> Зазвичай для аналізу використовують m перших головних компонент, сумарний внесок яких перевищує 60-70%.
Рівняння регресії на головних компонентах будується за алгоритмом покрокового регресійного аналізу, де в якості аргументів використовуються головні компоненти, а не вихідні показники. До гідності останньої моделі слід віднести той факт, що головні компоненти не корельовані. При побудові рівнянь регресії слід враховувати всі головні компоненти. br/>
54. Кластерний аналіз як метод багатовимірної класифікації
Кластерний аналіз найбільш яскраво відображає риси багатовимірного аналізу в класифікації, факторний аналіз - у дослідженні зв'язку. p align="justify"> Велике гідність кластерного аналізу в тому, що він дозволяє проводити розбиття об'єктів не по одному параметру, а по цілому набору ознак. Крім того, кластерний аналіз на відміну від більшості математико-статистичних методів не накладає ніяких обмежень на вигляд розглянутих об'єктів, і дозволяє розглядати безліч вихідних даних практично довільної природи. p align="justify"> Кластерний аналіз дозволяє розглядати досить великий обсяг інформації і різко скорочувати, стискати більші масиви соціально-економічної інформації, робити їх компактними та наочними.
Як і будь-який інший метод, кластерний аналіз має певні недоліки і обмеження: Зокрема, склад і кількість кластерів залежить від обираних критеріїв розбиття. При зведенні вихідного масиву даних до більш компактному увазі можуть виникати певні викривлення, а також можуть губитися індивідуальні риси окремих об'єктів за рахунок заміни їх характеристиками узагальнених значень параметрів кластера. При проведенні класифікації об'єктів ігнорується дуже часто можливість відсутності в розглянутій сукупності будь-яких значень кластерів. p align="justify"> Завдання кластерного аналізу полягає в тому, щоб на підставі даних, що містяться в безлічі Х, розбити безліч об'єктів G на m (m - ціле) кластерів (підмножин) Q1, Q2, ..., Qm, так, щоб кожний об'єкт Gj належав одному і тільки одній підмножині розбиття і щоб об'єкти, що належать одному і тому ж кластеру, були подібними, у той час, як об'єкти, що належать різним кластерам були різнорідними.
55. Метод найменших квадратів (МНК). Властивості МНК-оцінок в множині регресійному аналізі
Загальний вигляд КЛММР:
Постулюється взаємна некоррелірованні випадкових регресійних залишків (для ij). Той факт, що для всіх залишків? 1,? 2, ...,? N виконується співвідношення E? I2 =? 2, де величина? 2 від номера спостереження I не залежить, означає незмінність дисперсій регресійних залишків. Це властивість прийнято називати гомоскедастічностью регресійних залишків. p> Матрична форма запису КЛММР має вигляд:
В
МНК
Для оцінки вектора? найбільш часто використовують метод найменших квадратів (МНК), згідно з яким в якості оцінки приймають вектор b, який мінімізує суму квадратів відхилення спостережуваних значень yi від модельних значень?, тобто квадратичну форму:
В
Диференціюючи, з урахуванням квадратичну форму Q за вектором?:
В В
і прирівнюючи похідні нулю, отримаємо оцінку методу найменших квадратів:
Отримуємо вектор оцінок b, де b = (b0 b1 ... bk) T. p> Оцінка ковариационной матриці коефіцієнтів регресії вектора b визначається з виразу:
,
де
Властивості МНК-оцінок.
) спроможність (за ймовірністю) n??
для?,?> 0, n0, що для всіх обсягів вибірки виконується
p
2) Незміщеність
В
. Беручи мат. Очікування від лівої і правої частин з урахуванням того, що величини невипадкові, а середні значення залишків рівні 0, то отримуємо:. Тим самим показано, що МНК-оцінки невідомих параметрів КЛММР є незміщеними. p>) ефективність; 4) лінійність.
57. Інтервальне оцінювання коефіцієнтів рівняння регресії
Інтервальне оцінювання коефіцієнтів рівняння регресії
Регресійний аналіз - це статистичний метод дослідження залежності випадкової величини Y від змінних Xj (j = 1, 2, ..., k), що розглядаються в регресійному аналізі як невипадкові величини незалежно від істинного закону розподілу Xj. p align="justify"> Найбільш часто використовувана множинна лінійна модель регресійного аналізу м...