Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Курсовые обзорные » Пошук кластерів спільнот Live Journal за допомогою методів Data Mining в середовищі RapidMiner

Реферат Пошук кластерів спільнот Live Journal за допомогою методів Data Mining в середовищі RapidMiner





Конкуренція. Для кожного вихідного нейрона обчислюється відстань D ( ) між векторами ваг всіх нейронів вихідного шару і вектором вхідного впливу. Якщо в якості міри близькості двох векторів вибрано евклідова відстань, то отримаємо:


D ( ) = . br/>

Іншими словами, розраховується відстань між векторами ваг всіх нейронів вихідного шару і вектором вхідного впливу. Той нейрон j , для якого відстань виявиться найменшим, і буде переможцем. p align="justify"> 4. Об'єднання. Визначаються всі нейрони, розташовані в межах радіусу навчання щодо нейрона -переможця.

5. Підстроювання. Виробляється підстроювання ваг нейронів в межах радіусу навчання відповідно до формулою лінійної комбінації вхідних векторів і поточних векторів ваг:


В 

При цьому ваги нейронів, найближчих до нейрона-переможця, підлаштовуються у бік його вектора ваг.

6. Корекція. Змінюються радіус і параметр швидкості навчання відповідно із заданим законом . [4] [7]


2.5 Проблеми алгоритмів


Раніше ми вже відзначали, що одне і те ж безліч об'єктів можна розбити на кілька кластерів по-різному. Це призвело до достатку алгоритмів кластеризації. Мабуть, жодна інша задача Data Mining не має у своєму арсеналі стільки алгоритмів і методів рішення. p align="justify"> Причинами такої ситуації є кілька факторів, що мають загальне пояснення: не існує одного універсального алгоритму кластеризації. Перерахуємо ці чинники. p align="justify"> ВЁ Невизначеність у виборі критерію якості кластеризації;

ВЁ Складність вибору характеристик, на основі яких проводиться кластеризація;

ВЁ Складність вибору міри близькості, обумовлена ​​різною природою даних;

ВЁ Різні необхідні машинні ресурси (пам'ять і час);

ВЁ Вибір числа кластерів. [1] [2] [3] [4]

3. Середа RapidMiner


Програма RapidMiner (перша назва В«YaleВ») є середовищем для машинного навчання та аналізу даних, в якій користувач убезпечений від всієї В«чорнової роботиВ». Замість цього йому пропонується В«намалюватиВ» весь бажаний процес аналізу даних у вигляді ланцюжка (графа) операторів і запустити його на виконання. Ланцюжок операторів представляється у RapidMiner е у вигляді інтерактивного графа і у вигляді виразу на мові XML (eXtensible Markup Language, основної мови системи).


Назад | сторінка 8 з 18 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Технології аналізу даних (Text Mining, Data Mining)
  • Реферат на тему: Аналіз даних за допомогою технології Data Mining
  • Реферат на тему: Користувальницький інтерфейс програми кластеризації даних
  • Реферат на тему: Розрахунок параметрів ланцюга, вхідного і вихідного сигналів
  • Реферат на тему: Дослідження властивостей випадкових величин, планування багатофакторного ек ...