Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые обзорные » Пошук кластерів спільнот Live Journal за допомогою методів Data Mining в середовищі RapidMiner

Реферат Пошук кластерів спільнот Live Journal за допомогою методів Data Mining в середовищі RapidMiner





/span>


Результати кластеризації були записані у файл Microsoft Excel.

середу розробки RapidMiner пропонує багаті можливості для візуалізації результатів кластеризації. p align="justify"> Вивчивши рис. 5.13. ми зробили висновок: для візуальної інтерпретації результатів кластерного розбиття підходять тільки ті матричні графіки, на яких присутній атрибут commget .

Розглянемо більш детально матричний графік з атрибутами recnum і commget , названий нами умовно як В«M.RecNum-CommGetВ»


В 

Рис. 5.13. Всілякі варіанти матричних графіків


В 

Рис. 5.14. Матричний графік В«M.RecNum-CommGetВ»


На графіку добре проглядається результат розбиття вхідного набору даних. Точки є наші спільноти, а їх колір характеризує належність до того чи іншого кластеру. p align="justify"> Можна зробити попередній висновок: алгоритм кластеризації k-means впорався з покладеним на нього роботою, а число первинних кластерів було вибрано нами правильно.

У наступному розділі ми займемося перевіркою результатів кластеризації, ніж підтвердимо або спростуємо зроблений висновок. Але перш ніж приступити до перевірки, розглянемо ще пару графіків. br/>В 

Рис. 5.15. Графік відхилень значень атрибутів


В 

Рис. 5.16. Графік щільності розподілу


Рис. 5.15. показує відхилення значень параметрів об'єктів, а рис. 5.16. щільність розподілу записів у кластерах.


В 

Рис. 5.17. Кругова діаграма розподілу спільнот по кластерах


В 

Рис. 5.18. Порівняння результатів кластеризації з невключення в аналіз атрибутами


Для кожного кластера був зроблений розрахунок середніх значень атрибутів, які брали участь у процесі кластеризації.


Табл. 1. Середні значення атрибутів у кластерах

membernumreadernumrecnumcommgetwriternumcluster_0 8777,16172,938312,6840175,08761,3 cluster_1 310,8310,5401,41592,4289,8 cluster_2 1885,11793, 02961,226028,91880,3 cluster_3 5800,44104,216167,5174808,75810,8 cluster_4

Назад | сторінка 14 з 18 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Користувальницький інтерфейс програми кластеризації даних
  • Реферат на тему: Кластерний аналіз і метод гірської кластеризації
  • Реферат на тему: Удосконалення модуля ГІС РАПІД для виведення графіків розподілу значень шар ...
  • Реферат на тему: Перевірка статистичних гіпотез відносно невідоміх значень параметрів визнач ...
  • Реферат на тему: Облік фінансових результатів і розподілу прибутку організації