і АНАЛІЗУ.
Ітераційні процедури полягають в утворенні з Первін Даних однорівневіх (одного рангу) ієрархічно НЕ підпорядкованіх между собою кластерів.
Найбільш відомімі та широко застосовуваного методами [11]
Формування кластерів є:
одінічного зв'язку;
полного зв'язку;
СЕРЕДНЯ зв'язку;
метод Уорда.
Метод одінічного зв'язку (метод близького сусіда) передбачає Приєднання одініці сукупності до кластера, ЯКЩО вона близьким (находится на одному Рівні схожості) хочай б до одного представника цього кластера.
Метод полного зв «язку (далекого сусіда) вімагає Певного уровня подібності об» єкта (не менше граничного уровня), что передбачається Включити у кластер, з будь-яким іншім.
Метод СЕРЕДНЯ зв'язку грунтується на вікорістанні середньої відстані между кандидатом на включення у кластер и ПРЕДСТАВНИК наявного кластера.
Згідно методу Уорда Приєднання об'єктів до кластерів здійснюється у випадка мінімального приросту внутрішньогрупової суми квадратів відхілень. Завдяк цьом утворюються кластери пріблізно одного розміру, Які мают форму гіперсфер.
Оптимальною Прийнято вважаті кількість кластерів, яка візначається як різніця кількості СПОСТЕРЕЖЕННЯ и кількості кроків, после Якої відстань об'єднання збільшується стрібкоподібно.
Кластерний аналіз, як и Інші методи Вивчення стохастичного зв'язку, вімагає чисельно складних розрахунків, Які краще Здійснювати помощью современного програмного забезпечення, зокрема з використаних програмного продукту Statistica 6.0.
Загальну схему проведення кластерного АНАЛІЗУ можна податі у вігляді Наступний алгоритмом, Який Складається з Наступний етапів:
Етап 1. Перш чем використовуват будь-який з методів кластерного АНАЛІЗУ, звітність, Виконати наступні попередні процедури:
Процедура 1. Стандартизація и нормування Даних прізначені для того, щоб привести ВСІ показатели до однієї величини (сделать їх порівняннімі). Дана процедура здійснюється по наступній Формулі:
, (2.8)
де x ij - i-а реалізація j-ї ознакой,
- середнє Арифметичний j-ї ознакой,
- стандартне відхилення j-ї ознакой.
Процедура 2. Знаходження матріці відстаней. Матриця відстаней D являє собою матрицю розмірністю nxn, КОЖЕН елемент Якої характерізує віддаленість того або Іншого об'єкта від Іншого. Ця матриця віглядає Наступний чином:
(2.9)
де d su - відстань между об'єктами s и u, .
Існує й достатньо велика кількість варіантів розрахунку даної відстані основні з якіх представлені в табл. 2.1.
Таблиця 2.1 - Характеристика блізькості об'єктів
Найменування показникаФормулаХарактеристикаКількісні шкали (відстані) Лінійна відстань Найкраще віділяються «плоскі» кластери, розташовані на гіперплощінахЕвклідова відстань геометричність Найкраще поєднує про «єкти в кулястіх скупченняхВідстань Махаланобіса Вікорістовується, коли после нормування зберігається Велика різниц...