деним на 01.0.1.2007.
Вихідні дані
Об'єктами в даній роботі є: Центральний, Північно-Західний, Південний, Приволзький, Уральський, Сибірський, Далекосхідний федеральний округу. p> В якості ознак в даній роботі виступають: обсяг виданих кредитів фізичним особам, обсяг кредитів фізичним особам на покупку житла, середньозважений термін кредитування, середньозважена процентна ставка, обсяг іпотечних житлових кредитів фізичним особам, середньозважений термін кредитування (за іпотечними кредитами), середньозважена процентна ставка (за іпотечними кредитами).
В
2.1 Аналіз методом головних компонент
Метод головних компонент є методом візуалізації даних.
Методи візуалізації даних націлені на пошук найбільш виразних зображень сукупності досліджуваних об'єктів для подальшого максимального використання потенціалу зорового аналізатора експериментатора. p> Візуалізація даних передбачає отримання тим чи іншим способом графічного відображення сукупності об'єктів в нове координатне простір, в якості якого можуть бути використані або числова вісь, або площину, або тривимірний простір, максимально відображають особливості розподілу цих об'єктів у багатовимірному просторі. p> Відповідно до кількості вимірювань в новому координатному просторі можуть бути наступні способи візуального представлення:
- одномірне вимір, або 1-D ,
- двовимірне вимір, або 2-D ,
- тривимірне (Проекційне) вимір, або 3-D . p> З геометричних позицій алгоритм побудови головних компонент (ГК) полягає в наступному.
Виробляється центрування вихідних даних (рис.1а), початок координат переноситься в центр розподілу даних (центроид), що є центром еліпсоїда розсіювання випадкового вектора Х (рис.1б). <В
Рис. 2. Формування головних компонент
В
Потім здійснюється формування головних компонент F 1 , F 2 , ..., F p (ріс.1в). Лінійні комбінації вибираються таким чином, що серед усіх можливих комбінацій перша головна компонента F 1 ( X ) володіє найбільшою дисперсією. Дисперсія Пѓ прагне до максимуму: F 1 ( X ) = I = max Пѓ -> О© pi . Графічно це виглядає як орієнтація нової координатної осі F 1 вздовж напрямку найбільшою витягнутості еліпсоїда розсіювання об'єктів у вихідному просторі P ознак. а розкидом вздовж кількох останніх осей можна знехтувати. p> Друга головна компонента F 2 ( X ) перпендикулярна першій і будується виходячи з припущень знаходження максимальної дисперсії серед всіх залишилися лінійних комбінацій, некорельованих з першої ДК. p> Решта головні компоненти визначаються аналогічним способом.
Кількість головних компонент дорівнює кількості елементарних ознак.
Введемо вихідні дані у електронну таблицю STATGRAPHICS (48 * 8). p> Аналіз методом головних компонент складається з декількох етапів:
1) Необхідно отримати дані про результати аналізу (таблиця зведення) (рис.3)
В
рис.3 Зведення методу ГК
У Даною таблиці міститься інформація про результати побудови головних компонент: власні значення головних компонент ( eigenvalue ), упорядкованих за величиною, відсоток дисперсії ( percent of variance ), припадає на кожну виділену головну компоненту, накопичений відсоток дисперсії ( cumulative percentage ).
На основі отриманих результатів можна сідлати висновок про те, що перші 2 компоненти дають 80 відсотків дисперсії, що достатньо для проведення аналізу розподілу компонентів у просторі. p align=left> 2) Далі проаналізуємо таблицю ваг ознак (Рис. 4)
В
рис.4 Ваги ознак у головних компонентах
Визначимо залежність першої головної компоненти від ознак. Залежність від того чи іншої ознаки визначається величиною ознаки.
Перша головна компонента в найбільшою мірою залежить від 3 ознак:
обсяг кредитів, виданих фізичним особам, обсяг кредитів, виданих фізичним особам на купівлю житла, обсяг виданих іпотечних житлових кредитів фізичним особам.
Нижче представлена ​​проекція досліджуваної безлічі на простір трьох ГК (мал. 5).
В В
рис.5 Проекція досліджуваних об'єктів у простір трьох ГК
В
З рис.5 видно, що досліджувана сукупність розділилася на три класи. p align=left> 3) Визначимо значущі ознаки у складі головних компонент за такою формулою:
, де [ w kj ...