stify"> 3570,53254,06836,575957,93502,9
cluster_5 7809,65786,025104,1322164,27805,6
Відповідно до рис. 5.15., Рис. 5.18. і табл. 1 можна зробити висновок про те, що в розподілі спільнот по кластерах ключову роль зіграв атрибут commget .
Узагальнюючи отримані результати кластеризації можна сказати, що кожен кластер являє собою якийсь В«організмВ», а безліч вхідних у нього об'єктів - В«кліткиВ».
5.6 Перевірка результатів
Результати кластеризації завжди повинні бути перевірені формальними або неформальними методами. Формальні методи залежать від того методу, який використовувався для кластеризації. Неформальні включають такі процедури перевірки якості кластеризації:
ВЁ Аналіз результатів кластеризації, отриманих на певних вибірках набору даних;
ВЁ Крос-перевірка;
ВЁ Проведення кластеризації при зміні порядку спостережень у наборі даних;
ВЁ Проведення кластеризації при видаленні деяких спостережень;
ВЁ Проведення кластеризації на невеликих вибірках.
Один з варіантів перевірки якості кластеризації - використання декількох методів і порівняння отриманих результатів. Відсутність подібності не означатиме некоректність результатів, але присутність схожих груп вважається ознакою якісної кластеризації. p align="justify"> Перш ніж приступити до перевірки результатів кластеризації, проведемо невелику перевірку правильності вибору початкового числа кластерів.
У ході аналізу рис 5.11. деякими аналітиками може бути вибрано значення k = 11, яке є вкорне невірним. Спробуємо це довести. p align="justify"> Для доказу нашого твердження ми побудували Карти Кохонена для кластеризації зі значеннями k рівними 6 і 11.
В
Рис. 5.19. Карта Кохонена для кластеризації 6-ма кластерами
В
Рис. 5.20. Карта Кохонена для кластеризації 11-ма кластерами
Самоорганізуються карти Кохонена - один з приватних видів нейронних мереж. Карти Кохонена - інструмент для виявлення взаємозв'язків між об'єктами. Формально, карти Кохонена - це метод проектування багатовимірного простору спостережень на простір більш низької розмірності - карту. Тому карти Кохонена часто використовують для вирішення завдань візуалізація та кластеризації. p align="justify"> У кластеризації отримані кластери відображаються на двомірному малюнку, що дозволяє нам на...