у та групування даних є кластер-аналіз . Методи кластерного аналізу широко використовуються для класифікації об'єктів, стан яких або властивості яких м огут бути описані не однієї, а двома або кількома змінними (безліччю змінних).
У нашому випадку можливо використовувати кластер-аналіз як додаткове аналітичне засіб з огляду на те, що:
кластер-аналіз дозволяє отримати лише загальну картину по проблемі відмінності/схожості досліджуваних об'єктів;
кластер-аналіз з тим же набором даних, що і багатовимірне шкалювання, не дає можливості графічного аналізу.
Процедура кластерного аналізу полягає в наступному. Як і для багатовимірного шкалювання, ми відбираємо велика кількість факторів для аналізу (27 факторів і 21 регіон).
Для розрахунків, як і раніше, використовуємо можливості програми STATISTICA 6.
З метою усунення відмінностей в розмірності даних, стандартизуючи значення в матриці показників за допомогою формули (1):
.
Попередні розрахунки відстаней між об'єктами робити не треба, так як програма все зробить автоматично.
Для нашого випадку як засіб підтвердження зроблених раніше припущень вибираємо процедуру кластер-аналізу методом "k-середніх". Це дозволяє заздалегідь задати певне число кластерів, що надає свободу для маніпулювання даними на відміну від методу ієрархічного кластер-аналізу. Так як при графічному аналізі ми візуально виділяємо райони або їх групи, розташовані на відстані один від одного, то для більш чіткого виділення груп кластерів використовуємо опцію програми "Вибір центрів кластерів на максимальному відстані один від одного "у вікні процедури кластерного аналізу методом "K-середніх". p> Результати кластер-аналізу за методом "k-середніх" наведені в табл.4. Розподіл районів Гомельської області за групами (в разі використання 4 передбачуваних кластерів) дозволяє зробити висновок про правильності аналізу проведеного методом багатовимірного шкалювання. Вийшли чотири групи кластерів, що не відрізняються за складом від виділених раніше. Можна відзначити факт потрапляння Мозирського району в окремий кластер, що, за умови додаткового аналізу вихідних даних, дозволяє виділити його в окрему групу.
Таблиця 4
Розподіл районів за групами кластерів
Район
Відстань до центру кластера
Номер кластера
Гомельський
0,794433
2
Добрушський
0,5773537
2
Речицький
0,4128007
2
Світлогорський
0,6073875