очно і легко інтерпретувати зображення кластерів. [12] [13]
Порівнявши рис. 5.19. і рис 5.20. ми відзначили, що при кластеризації 6-ма кластерами об'єкти розподілені по кластерах компактними згустками. При кластеризації 11-ма кластерами дане явище менш помітно. p align="justify"> Наступною нашою процедурою в перевірці якості кластеризації було проведення кластеризації при видаленні деяких параметрів об'єктів. Для цього в середовищі RapidMiner був розроблений спеціальний процес пошуку відповідностей. Його робота полягає в пошуку схожих груп в результатах кластеризації по всіх і тільки двом атрибутам об'єктів. br/>В
Рис. 5.21. Ланцюжок операторів пошуку відповідностей
В
Рис. 5.22. Знайдені збіги при кластеризації 6-ма кластерами за атрибутами recnum і commget
В
Рис. 5.23. Знайдені збіги при кластеризації 6-ма кластерами за атрибутами recnum і readernum
Табл. 2. Результати збігів при кластеризації 6-ма кластерами за двома атрибутам
membernumreadernumrecnumcommgetwriternummembernum 18,163% 1,376% 0,275% 19,677% readernum < span align = "justify"> 18,163% 98,005% 0,275% 15,652% recnum 1,376% 98,005% 0,275% 11,971% commget 0,275% 0,275% 0,275% 0,275% writernum 19,677% 15,652% 11,971% 0,275%
Табл. 3. Результати збігів при кластеризації 11-ма кластерами за двома атрибутам
membernumreadernumrecnumcommgetwriternummembernum 1,891% 5,847% 0,034% 0,929% readernum < span align = "justify"> 1,891% 7,115% 0,034% 2,236% recnum 5,847% 7,115% 0% 0,825% commget 0,034% 0,034% 0% 0% writernum 0,929% 2,236% 0,825% 0%
На підставі рис. 5.23. і даних з табл. 2. і табл. 3., Отриманих в ході роботи процесу пошуку відповідностей, було підтверджено зроблене нами раніше твердження: алгоритм кластеризації k-means впорався з покладеним на нього роботою, а число первинних кластерів було вибрано нами правильно. p align="center"> 6. Висновок
Ця...