Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Вивчення методів інтелектуального аналізу даних у середовищі Statgraphics: кластерний аналіз, компонентний аналіз

Реферат Вивчення методів інтелектуального аналізу даних у середовищі Statgraphics: кластерний аналіз, компонентний аналіз





"justify"> де, Y1 - продуктивність праці;

X5 - питома вага робітників у складі промислово-виробничого персоналу;

X7 - коефіцієнт змінності устаткування (змін);

X9 - питома вага втрат від браку (%);

X10 - фондовіддача активної частини основних виробничих фондів.

Крок 2. Вибір значущих головних компонент.

Методи візуалізації даних є методами аналізу даних без учителя і мають на меті виявлення структури даних на основі з'ясування взаємин між об'єктами і їх ознаками. Результатом застосування цих методів є візуальне уявлення про структуру даних.

Зведення результатів аналізу методом головних компонент, наведена на малюнку 1.

Малюнок 1 Зведення результатів аналізу методом головних компонент.


Тут перераховані змінні, що беруть участь в аналізі; вказано кількість об'єктів аналізу - 17. Далі представлена ??інформація про: власних значеннях головних компонент (eigenvalue), упорядкованих за величиною; відсотку дисперсії (percent of variance), що припадає на кожну виділену головну компоненту; накопиченому відсотку дисперсії (cumulative percentage).

Наведені цифри говорять про те, що вже перші чотири головні компоненти описують 95,211% дисперсії вихідних даних. П'ята головна компонента додає ще приблизно 4,789% дисперсії, так, що в сумі виходить 100,0% дисперсії.

Далі необхідно видати таблицю ваг ознак в головних компонентах.

Для цього натиснути на праву клавішу миші, вибрати пункт Analysis Options. У вікні «Principal Components Options» в полі «Number of Components» встановити кількість компонент, рівне чотирьом. Це необхідно також для подальшої побудови 3-D діаграми розсіювання в просторі чотирьох головних компонент.

Натиснути кнопку табличних опцій «Tabular Options» меню вікна «Principal Components Analysis» і у відповідному вікні діалогу встановити прапорець компонентних ваг Component Weights. На малюнку 2 представлена ??вийшла таблиця ваг ознак в головних компонентах.


Малюнок 2 Таблиця ваг ознак в головних компонентах


Як випливає з отриманих даних про вагових коефіцієнтах, в 1-й головною компоненті ознаки «коеф. змінності устаткування »,« продуктивність туди »,« уд. вага втрат від браку »і« фондовіддача активної частини »мають досить великі і приблизно однакові за величиною позитивні коефіцієнти. У 2-й головною компоненті тільки ознака «питома вага робітників» має високий ваговий коефіцієнт. У третьому головною компоненті спостерігаються великі за модулем вагові коефіцієнти у ознак «коеф. змінності устаткування ». Ці ознаки, отже, є значущими і можуть брати участь у формуванні закономірностей типу «класифікація».

Крок 3 Формування кластерів.

Побудувати 3-D діаграму розсіювання всієї сукупності підприємств у просторі виділених трьох перших головних компонент. Для цього натиснути на кнопку меню «Graphical options» у вікні «Principal Components Analysis» і вибрати тривимірне відображення «3-D Scatterplot» (рис. 8). Для максимального розкриття вікна можна двічі клацнути по діаграмі.


Рисунок 3 Проекція досліджуваних підприємств в простір трьох головних компонент


На представленому малюнку видно, що вся досліджувана сукупність підприємств розділилася на три досить чітко виражені групи.


Малюнок 4- Проекція досліджуваних підприємств в простір двох головних компонент


На малюнку 4 видно, що ми виділили 3 кластера і пронумерували їх.

Коефіцієнт інформативності gt; 0,75. Розраховуємо його за формулою:

Кінфо.=0,918946= (0,53167 ^ 2 + 0,624982 ^ 2 + 0,495652 ^ 2)

(0,282342 ^ 2 + 0,624982 ^ 2 + 0,036568 ^ 2 + 0,495652 ^ 2 + 0,53167 ^ 2)

Вважаємо також на 1 компоненту більше, і отримуємо значення 0,998663,

і на 1 компоненту менше, і отримуємо значення 0,673275.

Повертаємося до первісного коефіцієнту інформативності рівному 0,9189.

Крок 3. Формулюємо назву на основі найбільш вагомих ознак (тобто продуктивність праці, питомих вага втрат від браку, фондовіддача активної частини). Сформований назва - Ефективність виробництва.

Крок 4. Формуємо правила кластеризації у просторі головних компонент. У таблиці 2 представлені ці правила.


Таблиця 2 - Правила кластеризації

№Component 1Component 21МалаяМалая 2СредняяМалая, середня, висока 3В...


Назад | сторінка 3 з 4 | Наступна сторінка





Схожі реферати:

  • Реферат на тему: Застосування методу головних компонент для аналізу електроенцефалограм
  • Реферат на тему: Ожиріння - одна з головних проблем людства в XXI столітті
  • Реферат на тему: Вибір головних схем електричних з'єднань і основного обладнання районно ...
  • Реферат на тему: Безробіття як одна з головних соціальних проблем ринкового суспільства
  • Реферат на тему: Історія становлення головних вулиць Харкова: етапи і сучасні тенденції