кнопку «Graphical options» і установливается прапорець 2D Scatterplot. Діаграма розсіювання показує, як групуються досліджувані спостереження на площині двох змінних коефіцієнт змінності устаткування і продуктивність праці. Кожен кластер представлений на діаграмі власним символом і кольором.
Для того, щоб побудувати діаграми розсіювання на площині інших ознак, досить клацнути правою кнопкою миші і, вибравши пункт «Pane Options», вибрати цікавлять пари змінних (см.рисунок 5).
Малюнок 5 - Діаграма розсіювання, отримана в результаті кластерного аналізу
продуктивність дендрограмма кластеризація
Далі необхідно визначити списки номерів об'єктів по всіх виділених кластерам компонетни і кластерного аналізу (табл. 2). Дані щодо компонентного аналізу представлені у додатку.
Таблиця 2 - Номери об'єктів по виділених кластерам
№ кластераКомпонентний аналіз№ кластераКластерний аналіз31, 2, 3, 4, 5, 6,7, 8, 911, 2, 3, 4, 5, 6,7, 8, 9114210210, 11, 12 , 13, 15, 16, 17311, 12, 13, 14, 15, 16, 17
З отриманих даних, представлених в таблиці 2 видно, що 3 кластер, отриманий в компонентному аналізі, повністю збігається з 1 кластером, отриманий в кластерному аналізі. 2 кластер, отриманий в кластерному аналізі входить до 2 кластер, отриманий в компонентному аналізі. 1 кластер, отриманий в компонентному аналізі входить в 3 кластер, отриманий в кластерному аналізі.
. Сформулюємо правила кластеризації, що характеризують передбачувані групи, на основі аналізу координат центроїдів. Координати центроїдів представлені на малюнку 1. На основі одержаного аналізу розкиду значень координат центроїдів виявляються ознаки, які мають досить великий дискримінантної (розділяє) силою.
Таким чином, виділяємо наступні ознаки: продуктивність праці; питома вага втрат від браку і фондовіддача активної частини основних виробничих фондів, представлені в таблиці 3.
Таблиця 3 - Ознаки, що володіють найбільшою классифицирующей силою
№ кластераПроізводітельность трудаУдельний вага втрат від бракаФондоотдача активної частини основних виробничих фондов19,9544 (об) 0,2811 (м) 1,8122 (б) 25,49 (м) 0,05 (ом) 1 , 02 (ом) 35,9171 (с) 0,6428 (б) 1,1085 (с)
На основі даних таблиці 3, формулюємо правила кластеризації
Якщо продуктивність праці дуже велика і питома вага втрати від браку малий і фондовіддача активної частини основних виробничих фондів велика, то кластер 1.
Якщо продуктивність праці мала і питома вага втрати від браку дуже малий і фондовіддача активної частини основних виробничих фондів дуже мала, то кластер 2.
Якщо продуктивність праці середня і питома вага втрати від браку великий і фондовіддача активної частини основних виробничих фондів середня, то кластер 3.
За отриманими результатами було виділено 3 кластера. Перший кластер характеризується дуже великою продуктивністю праці та малою питомою вагою втрати від браку і великий фондоотдачей активної частини основних виробничих фондів. Другий кластер характеризується малою продуктивністю праці і дуже малою питомою вагою втрати від браку та дуже малою фондоотдачей активної частини основних виробничих фондів. Третій кластер характеризується середньою продуктивністю праці і великою питомою вагою втрати від браку та середньої фондоотдачей активної частини основних виробничих фондів.
У ході проведення аналізу були виявлені подібності та відмінності компонентного і кластерного аналізу. 3 кластер, отриманий в компонентному аналізі, повністю збігається з 1 кластером, отриманий в кластерному аналізі. 2 кластер, отриманий в кластерному аналізі входить до 2 кластер, отриманий в компонентному аналізі. 1 кластер, отриманий в компонентному аналізі входить в 3 кластер, отриманий в кластерному аналізі.
Робота 2
Метою роботи є вивчення особливостей виконання компонентного аналізу в середовищі StatGraphics і застосування отриманих результатів для дослідження структури даних і отримання знань.
Крок 1. Вихідні дані для виконання компонентного аналізу представлені в таблиці 1.
Таблиця 1 Вихідні дані
№ предпріятіяy 1х 5х 7х 9х 1019,260,781,370,231,45 .29,380,751,490,391,3312,110,681,440,431,37410,810,71,420,181,6559,350,621,350,151,9169,870,761,390,341,68249,370,791,40,212,32910,020,761,220,322,62439,420,71,20,282,03125,490,741,10,051,02146,610,721,230,480,88154,320,681,390,410,62167,370,771,380,621,09235,520,721,241,20,68275,680,711,280,661,43285,220,791,330,741,82416,70,791,350,391,24