Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые обзорные » Пошук кластерів спільнот Live Journal за допомогою методів Data Mining в середовищі RapidMiner

Реферат Пошук кластерів спільнот Live Journal за допомогою методів Data Mining в середовищі RapidMiner





stify"> 3570,53254,06836,575957,93502,9 cluster_5 7809,65786,025104,1322164,27805,6

Відповідно до рис. 5.15., Рис. 5.18. і табл. 1 можна зробити висновок про те, що в розподілі спільнот по кластерах ключову роль зіграв атрибут commget .

Узагальнюючи отримані результати кластеризації можна сказати, що кожен кластер являє собою якийсь В«організмВ», а безліч вхідних у нього об'єктів - В«кліткиВ».


5.6 Перевірка результатів


Результати кластеризації завжди повинні бути перевірені формальними або неформальними методами. Формальні методи залежать від того методу, який використовувався для кластеризації. Неформальні включають такі процедури перевірки якості кластеризації:

ВЁ Аналіз результатів кластеризації, отриманих на певних вибірках набору даних;

ВЁ Крос-перевірка;

ВЁ Проведення кластеризації при зміні порядку спостережень у наборі даних;

ВЁ Проведення кластеризації при видаленні деяких спостережень;

ВЁ Проведення кластеризації на невеликих вибірках.

Один з варіантів перевірки якості кластеризації - використання декількох методів і порівняння отриманих результатів. Відсутність подібності не означатиме некоректність результатів, але присутність схожих груп вважається ознакою якісної кластеризації. p align="justify"> Перш ніж приступити до перевірки результатів кластеризації, проведемо невелику перевірку правильності вибору початкового числа кластерів.

У ході аналізу рис 5.11. деякими аналітиками може бути вибрано значення k = 11, яке є вкорне невірним. Спробуємо це довести. p align="justify"> Для доказу нашого твердження ми побудували Карти Кохонена для кластеризації зі значеннями k рівними 6 і 11.


В 

Рис. 5.19. Карта Кохонена для кластеризації 6-ма кластерами


В 

Рис. 5.20. Карта Кохонена для кластеризації 11-ма кластерами


Самоорганізуються карти Кохонена - один з приватних видів нейронних мереж. Карти Кохонена - інструмент для виявлення взаємозв'язків між об'єктами. Формально, карти Кохонена - це метод проектування багатовимірного простору спостережень на простір більш низької розмірності - карту. Тому карти Кохонена часто використовують для вирішення завдань візуалізація та кластеризації. p align="justify"> У кластеризації отримані кластери відображаються на двомірному малюнку, що дозволяє нам на...


Назад | сторінка 15 з 18 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Користувальницький інтерфейс програми кластеризації даних
  • Реферат на тему: Кластерний аналіз і метод гірської кластеризації
  • Реферат на тему: Оформлення результатів аудиторської перевірки відповідно до міжнародних ста ...
  • Реферат на тему: Обробка результатів спостережень при прямих вимірах
  • Реферат на тему: Розробка інтерактивної карти маршрутів міського пасажирського транспорту м ...